英伟达发布Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万token
美东时间9月9日周二,英伟达发布新一代Rubin CPX芯片系统,专门针对AI视频生成和软件开发等大规模上下文处理任务,强化AI编码和视频处理能力。
Rubin CPX定于2026年底上市,采用卡片形式,可集成到现有服务器设计中或作为独立计算设备在数据中心运行。
这款芯片系统在技术规格上实现重大突破。Rubin CPX GPU提供30千万亿次浮点(petaflops)运算能力(NVFP4精度),配备128GB GDDR7内存,支持视频解码和编码的硬件,相比英伟达GB300 NVL72系统,注意力加速3倍。
完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,提供8 exaflops AI性能,性能为英伟达GB300 NVL72系统的7.5倍。
英伟达CEO黄仁勋表示,Rubin CPX是首款专为百万级token处理而构建的CUDA GPU。他说:
延伸阅读:
库克称AirPods Pro 3太火了,苹果始料未及
IT之家 1 月 30 日消息,路透社今天(1 月 30 日)发布博文,报道称在 2026 财年第 1 财季(截至 20...
中信证券:海外AI模型与应用密集催化推动下 算力产业链或迎来新一轮上涨
智通财经APP获悉,中信证券发布研报称,近期,海外推理和训练算力需求旺盛,亚马逊云和谷歌云双双涨价。推理侧、训练侧对于云...
新研究揭示开源AI模型安全风险:若脱离限制运行或将被黑客劫持
IT之家 1 月 30 日消息,路透社 1 月 29 日援引一项最新研究称,开源大语言模型若脱离主流平台的护栏与限制,在...
iPhone录得历史最佳季度表现,但苹果预计存储涨价将影响毛利率
当地时间1月29日,苹果发布了截至2025年12月27日的2026财年第一季度财报。该季度苹果营收1437.6亿美元,同...
