英伟达发布Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万token
美东时间9月9日周二,英伟达发布新一代Rubin CPX芯片系统,专门针对AI视频生成和软件开发等大规模上下文处理任务,强化AI编码和视频处理能力。
Rubin CPX定于2026年底上市,采用卡片形式,可集成到现有服务器设计中或作为独立计算设备在数据中心运行。
这款芯片系统在技术规格上实现重大突破。Rubin CPX GPU提供30千万亿次浮点(petaflops)运算能力(NVFP4精度),配备128GB GDDR7内存,支持视频解码和编码的硬件,相比英伟达GB300 NVL72系统,注意力加速3倍。
完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,提供8 exaflops AI性能,性能为英伟达GB300 NVL72系统的7.5倍。
英伟达CEO黄仁勋表示,Rubin CPX是首款专为百万级token处理而构建的CUDA GPU。他说:
延伸阅读:
突破HBM容量限制:铠侠宣布推出超高IOPS SSD,让GPU直连闪存
IT之家 3 月 17 日消息,铠侠今日亮相 NVIDIA GTC 2026 大会,并宣布推出一种全新类型的 SSD 产...
李彦宏牵头的AI生命科学公司赴港上市;永辉公开喊话山姆丨邦早报
【黄仁勋狂扔“核弹”:1万亿营收、LPU、太空芯片、一键“养虾”】北京时间今日凌晨,“AI春晚”英伟达年度GTC大会拉开...
高盛快评黄仁勋GTC讲话:满足了投资者两项关键预期
英伟达首席执行官黄仁勋在GTC 2026大会上的主题演讲释放出强劲的长期增长信号,成功满足了市场对算力需求前景和推理市场...
GTC2026|美光科技开始为英伟达量产HBM4内存,速率比上一代HBM3E提升约2.3倍
3月17日,在今天凌晨进行的英伟达 GPU 技术大会(GTC)中,美光宣布旗下多款存储产品已同步进入大规模量产阶段,这些...
英伟达发布“太空算力模块”,“太空版” Vera Rubin后续将推出
英伟达正将其AI计算版图延伸至地球轨道。在隔夜GTC年度开发者大会上,英伟达宣布推出面向太空场景的专用计算模块,并披露了...
