Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活
IT之家 8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称 CoreWeave 最新测试显示,以 DeepSeek R1 推理模型实测,4 块英伟达 Blackwell 架构 GB300 芯片就能完成原需 16 块 H100 的任务,单卡吞吐量提升 6 倍。
IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。
GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。
CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。
延伸阅读:
OpenAI下调高端服务门槛,推出100美元Pro订阅、直指Anthropic
在生成式AI竞争持续升温之际,OpenAI于美东时间9日周四宣布,推出全新的100美元/月ChatGPT Pro订阅方案...
海特高新:成功研制并交付国内首台eVTOL模拟器及相关仿真解决方案
有投资者向海特高新(002023.SZ)提问,请问公司管理层,公司在低空飞行模拟器这一块,目前主要方向是在人为主,还是工...
早期项目 | 字节、OPPO、一加三重背景产品人,将软硬一体写入底层,要让AI看懂世界
作者丨欧雪编辑丨袁斯来过去两年,主流AI交互依赖于输入框——用户先组织语言提问,AI再给出答案。这种“对话式”交互效率极...
合十思维赵普:中德机器人合作不是零和博弈,而是双向赋能优势互补
来源:环球网【环球网财经 记者 陈超】“德国并不缺人工智能,也不缺机器人。技术并不是德国的短板。”近日,在由德国北威州国...
