智能体时代，算力成本成关键战场

摸鱼小能手
科技前沿
2025年12月25日

在AI产业快速发展的今天，智能体的规模化落地已成为行业竞争的核心。随着技术不断进步，企业开始意识到，单纯追求模型性能已不再是唯一目标，如何有效降低运营成本，成为决定企业能否持续盈利的关键因素。浪潮信息首席AI战略官刘军指出，当前AI产业正面临一场“降本”与“盈利”的生死较量，只有真正实现成本的大幅下降，才能推动智能体的广泛应用。

在这一背景下，浪潮信息推出了元脑HC1000超扩展AI服务器，该产品将推理成本首次降至1元/每百万token。这一突破不仅为智能体的产业化落地扫清了障碍，也重新定义了AI产业的竞争格局。刘军强调，尽管目前的成本已经取得显著进展，但面对未来Token消耗量的指数级增长，现有的成本水平仍难以满足大规模应用的需求。

回顾互联网的发展历程，每一次基础设施的升级都伴随着成本的显著下降，从而催生出新的应用场景。例如，从拨号上网到光纤入户，再到4G/5G时代的普及，通信成本的降低推动了视频流媒体、移动支付等新兴业态的兴起。如今，AI产业也正处于类似的临界点。随着技术进步，Token单价不断下降，企业得以将AI应用于更复杂、更耗能的场景，如支持超长上下文、具备多步规划能力的智能体。然而，Token消耗量的激增也带来了新的挑战。

据火山引擎最新数据显示，字节跳动旗下豆包大模型的日均Token使用量已突破50万亿，较去年同期增长超过10倍。谷歌的数据显示，其各平台每月处理的Token用量已达1300万亿，相当于日均43.3万亿。这些数据表明，Token消耗量的增长速度远超预期，若成本下降速度无法跟上，企业将面临巨大的财务压力。

刘军指出，Token成本直接决定了智能体的盈利能力。要让AI真正进入规模化普惠阶段，必须实现Token成本的进一步下降。为此，浪潮信息通过重构系统架构，实现了计算效率的大幅提升。元脑HC1000采用全新设计的全对称DirectCom极速架构，能够高效聚合海量本土AI芯片，支持极高的推理吞吐量，为智能体突破Token成本瓶颈提供了强有力的支持。

元脑HC1000创新性地采用了直达通信设计，解决了传统架构中的协议转换和带宽争抢问题，实现了超低延迟。同时，计算与通信的1:1均衡配比，确保了全局无阻塞通信。此外，全对称的系统拓扑设计，使得PD分离、AF分离方案得以灵活配置，最大化资源利用率。

在实际应用中，元脑HC1000通过自适应路由和智能拥塞控制算法，实现了数据包级的动态负载均衡，有效降低了KV Cache传输对Prefill、Decode计算实例的影响。这不仅提升了整体性能，还进一步优化了成本结构。

刘军表示，未来AI产业的产品技术创新将从规模导向转向效率导向，从根本上重新思考和设计AI计算系统。发展AI专用计算架构，探索开发大模型芯片，推动算法硬件化的专用计算架构创新，将成为未来的重要方向。只有这样，才能真正实现Token成本的持续、数量级下降，为智能体的广泛应用奠定坚实基础。

#ai产业 #token #刘军(足球守门员)#数据中心 #浪潮信息 #算法

摸鱼小能手

暂无介绍....

医械网	工业品资讯
广告位	广告位

智能体时代，算力成本成关键战场

摸鱼小能手

《移动电源安全标准即将出台，行业迎来新规范》

智能座舱新纪元：博世AI技术引领人车交互革命

延伸阅读:

总不能山姆的什么锅都让阿里背吧

谷歌为Chrome浏览器发布安全更新，修复8项高危安全漏洞问题

三星Galaxy Z Fold8折叠手机渲染图曝光：外6.5/内8英寸屏幕

你是否在雪山救过一只狐狸？

1元买软件、5元买服务配音演员声音是如何被批量“偷走”的？