国金证券:算力再次加速的底层逻辑 长Agent驱动算力需求非线性提升
智通财经APP获悉,国金证券发布研报称,计算机行业AI交互正从单次问答转向自主长时运行Agent,OpenClaw等开源项目爆火印证此趋势。Agent任务Token消耗达传统对话4至15倍, 长Agent驱动算力需求非线性提升,杰文斯悖论进一步放大效应,推动内存带宽与算力密度持续扩张。
国金证券主要观点如下:
计算需求范式跃迁:从Prompt到长Agent
1)人工智能的交互范式正在经历根本性转变,AI系统已从单次问答工具演进为能够推理、规划、持续运行的自主Agent,趋势已获明确印证:OpenRouter平台数据显示多步骤推理和链式工具调用正在快速取代传统单轮交互。开源Agent框架OpenClaw发布仅四个多月便以超过24.8万GitHub星标登顶全球开源项目榜首,标志着长运行Agent从实验阶段全面进入生产部署。2)Agent任务对Token的消耗已远超传统问答场景:Anthropic实测数据显示,单Agent消耗约为对话模式的4倍,多Agent系统则高达15倍。NVIDIA在其2026年1月技术博客中亦明确指出,下一代AI工厂必须具备处理数十万输入Token的能力,以支撑Agentic推理所需的长上下文。范式跃迁已经发生,算力需求的新增长逻辑形成。
长Agent驱动算力需求非线性提升
长Agent对算力需求的拉动有几个核心原因:1)技术机制:首先大模型自注意力机制的计算成本与上下文长度呈二次方增长,其次推理Decode阶段天然受制于内存带宽,随着KVCache随上下文线性膨胀,GPU利用率持续下降,吞吐瓶颈日益突出,主流厂商的定价结构就是物理成本的体现:谷歌Gemini 3.1 Pro和阿里云Qwen均采用按上下文长度分档的阶梯定价。2)多Agent协作架构的兴起引入了额外的通信开销维度。Gartner数据显示,2024年Q1至2025年Q2企业对多Agent系统的询盘量暴增1445%;而Google DeepMind研究指出,并行Agent之间的全局上下文压缩传递会产生不可避免的”协调税”,通信成本随Agent数量非线性扩大。3)杰文斯悖论进一步放大了上述效应,微软CEO纳德拉预判,模型推理效率的提升带来成本下降反而刺激使用量以更快速度增长。综合分析,该行认为Agent运行时长的增加是技术趋势的必然,在可见的未来,对内存带宽、互联吞吐与智能计算密度的需求,将持续以非线性速率扩张。
投资建议相关标的:
海外算力/存储:中际旭创、东山精密、胜宏科技、天孚通信、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克等;Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。
国内算力:寒武纪、东阳光、海光信息、协创数据、豫能控股、华丰科技、亿田智能、星环科技、网宿科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。
CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。
AI应用:1)超级入口:腾讯控股、Minimax、智谱、阿里巴巴、科大讯飞。2)星环科技、德才股份、美年健康、中控技术、卓易信息、昆仑万维等AIINFRA&高增长&高壁垒。其他:空天时代、具身智能等。
风险提示
行业竞争加剧的风险;技术迭代不及预期的风险;特定行业下游资本开支周期性波动的风险。
延伸阅读:
傅里叶今起招股 拟全球发售1200万股H股
傅里叶招股时间为2026年3月23日至3月26日。拟全球发售1200万股H股(其中香港发售占5%,国际发售占95%),发...
傅里叶今起招股 拟全球发售1200万股H股
傅里叶招股时间为2026年3月23日至3月26日。拟全球发售1200万股H股(其中香港发售占5%,国际发售占95%),发...
机械革命苍龙18 Pro笔记本上架,9299元起
IT之家 3 月 23 日消息,机械革命现已在京东上架苍龙 18 Pro 游戏本,该机可选 R9-8945HX 或者 R...
美光CEO梅赫罗特拉:L4自动驾驶普及后,一辆车所需内存将超300GB
IT之家 3 月 23 日消息,当地时间 3 月 19 日,据《The Register》报道,美光 CEO 桑杰 · ...
AI开始侵入各行各业:“编程自动化”之后,AI巨头奔向“一切自动化”
AI编程工具的爆发式增长,正在将整个科技行业推向一个更宏大的野心:用自然语言指令自动化人类生活的方方面面。这场竞赛已不再...
