Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活
IT之家 8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称 CoreWeave 最新测试显示,以 DeepSeek R1 推理模型实测,4 块英伟达 Blackwell 架构 GB300 芯片就能完成原需 16 块 H100 的任务,单卡吞吐量提升 6 倍。
IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。
GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。
CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。
延伸阅读:
推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新成果TagCF
每天,推荐系统都在捕捉我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的理解上,推断用户喜欢哪类视频...
院士选举:如何保障学术公正,回归纯粹的荣誉属性
图源:Unsplash / Element5 Digital今年新当选的 144 位院士名单公布后,围绕院士选举的评审方...
华为Mate 80 Pro Max手机备件价格公布,屏幕单体留件价1399元
IT之家 11 月 27 日消息,华为 Mate 80 Pro Max 手机备件价格现已公布,更换屏幕单体的留件价是 1...
TPU算力狂热席卷而来! 三大关键词贯穿新一轮AI投资热潮:ASIC、光互连与存储
智通财经APP获悉,随着美国科技巨擘谷歌在上周重磅推出Gemini3 AI应用生态之后,这一最前沿AI应用软件随即风靡全...
5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建
henry 发自 凹非寺量子位 | 公众号成立两年半,再添近5亿元A+轮融资——截至目前,无问芯穹已累计吸金近15亿,成...
