Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活
IT之家 8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称 CoreWeave 最新测试显示,以 DeepSeek R1 推理模型实测,4 块英伟达 Blackwell 架构 GB300 芯片就能完成原需 16 块 H100 的任务,单卡吞吐量提升 6 倍。
IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。
GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。
CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。
延伸阅读:
博通的AI布局迎来新机遇,高盛持续看好其长期价值
尽管博通未能如部分投资者预期那样上调2026财年的全年业绩指引,并在短期内可能面临股价回调压力,但高盛依然重申了对该公司...
新型硅碳复合负极材料取得重大突破 为高稳定性电池研发开辟新路径
人民财讯12月12日电,近期,中国科学院合肥物质院固体所王振洋研究员团队在锂离子电池硅碳复合负极材料领域取得系列进展。团...
智能硬件新风口:京东高薪引才布局端侧AI芯片
据《科创板日报》报道,京东正在招募端侧AI芯片领域人才,招聘方向集中在存算一体AI芯片领域,产品可能用于机器人、智能家电...
米老鼠助力Sora?OpenAI与迪士尼达成重磅合作
天下果然没有免费的午餐!为了让“米老鼠”加入Sora,OpenAI刚刚正式官宣与迪士尼达成合作。协议内容之一即为,Ope...
