Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活
IT之家 8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称 CoreWeave 最新测试显示,以 DeepSeek R1 推理模型实测,4 块英伟达 Blackwell 架构 GB300 芯片就能完成原需 16 块 H100 的任务,单卡吞吐量提升 6 倍。
IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。
GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。
CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。
延伸阅读:
SpaceX星舰V3完成全时长静态点火测试,首次试飞临近
IT之家 4 月 16 日消息,在得克萨斯州星舰基地完成全时长静态点火测试后,SpaceX 距离发射下一代星舰又近了一大...
科大讯飞AI智能鼠标AM50 pro发布,498元
IT之家 4 月 16 日消息,科大讯飞现已在京东上架一款 AI 智能鼠标 AM50pro,其内置 AI 功能、支持星闪...
荣耀MagicBook 14/16 2026款笔记本发布,国补价5949.15元起
IT之家 4 月 16 日消息,荣耀今日发布了 MagicBook 14/16 2026 款笔记本新品,国补价 5949...
数据中心绿电直连落地难在成本高,需从新型电力系统构建出发
“绿电直连”以负荷主体为中心,由可再生能源通过直连线路,向单一电力用户供给绿电,用于满足其负荷需求,当前备受关注。据国家...
腾讯混元3D世界模型2.0发布 一句话生成3D资产
快科技4月16日消息,今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。官方表示,该模型一句话...
