Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活
IT之家 8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称 CoreWeave 最新测试显示,以 DeepSeek R1 推理模型实测,4 块英伟达 Blackwell 架构 GB300 芯片就能完成原需 16 块 H100 的任务,单卡吞吐量提升 6 倍。
IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。
GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。
CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。
延伸阅读:
中信建投:乘用车出口持续超预期 智驾及机器人布局正当时
人民财讯4月9日电,中信建投指出,本周主机厂3月产销量数据密集发布,出口及高端车销量表现再超预期,继续提示在海外因地缘冲...
京东开源图像模型JoyAI-Image-Edit
IT之家 4 月 9 日消息,4 月 7 日,京东探索研究院宣布正式开源自研的 JoyAI-Image-Edit 图像模...
早报|B站推出播放页暂停广告/GoPro启动大规模裁员/Meta时隔9个月再发大模型,被指「图表造假」
匿名模型「快乐马」HappyHorse-1.0 屠榜 AI 视频榜单☁️阿里巴巴 AI 大重组:设技术委员会、建 ATH...
Pro档唯一双2亿旗舰来了!OPPO Find X9s Pro外观偷跑
快科技4月9日消息,OPPO Find X9s Pro定档4月21日正式发布。知名爆料人士evleaks提前晒出了该机的...
