Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活
IT之家 8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称 CoreWeave 最新测试显示,以 DeepSeek R1 推理模型实测,4 块英伟达 Blackwell 架构 GB300 芯片就能完成原需 16 块 H100 的任务,单卡吞吐量提升 6 倍。
IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。
GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。
CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。
延伸阅读:
三星Galaxy S26 Ultra设计革新曝光:圆润机身回归与影像系统全面进化
IT之家 12 月 31 日消息,消息源 @Onleaks 昨日(12 月 30 日)在 X 平台发布推文,分享了一段视...
未来之基:2025中国AI创新全景图谱
1硅星人 2025「年度平台技术榜」这是托住 AI 创作者与开发者底层想象力的一组名字——从算力、模型到工具链,它们不在...
生命探索的黄金时代:地球隐藏版图正被揭开
来源:科技日报科技日报记者 张梦然一项最新研究显示,地球“生命图谱”远未完整,而今正迎来物种发现的“黄金时代”:美国亚利...
宇宙初生之谜揭晓:氘核诞生于高能火球的瞬息衰变
来源:科技日报科技日报记者 刘霞德国慕尼黑工业大学等机构科学家借助欧洲核子研究中心大型强子对撞机(LHC)的内部碰撞,揭...
安卓最大免费开源应用仓库F-Droid完成“换心”,实现一天两更
IT之家 12 月 31 日消息,科技媒体 NeoWin 昨日(12 月 30 日)发布博文,报道称安卓平台上最大的免费...
