新型专用计算芯片成功研发
来源:光明日报
本报北京1月21日电(记者晋浩天)当你点开社交平台,瞬间看到心仪的电影推荐;当购物网站精准呈现你可能喜欢的商品——这些智能服务背后,是计算系统在海量数据中进行的急速运算与抉择。然而,支撑这一切的传统计算芯片正在面临速度与能耗的双重压力,科学家们将目光投向超越传统数字计算的新架构。北京大学孙仲研究员团队在这一前沿领域取得关键突破,成功研发出高能效的新型专用计算芯片,首次为繁复的计算任务提供了专用硬件加速方案。实验表明,相较于先进数字芯片,该系统计算速度提升约12倍,能效比提升超过228倍。相关成果发表于国际期刊《自然·通讯》。
“这项研究瞄准了机器学习中的一项核心任务——非负矩阵分解。该技术如同一位高效的‘数据解读者’,能从巨量且庞杂的用户行为、图像像素等信息中,提炼出潜在的模式与特征,在图像分析、信息聚类、个性化推荐等领域具有广泛应用。然而,它的计算过程要求同步求解两个矩阵,极为繁复,依赖传统数字芯片的串行计算模式,往往力不从心,成为制约实时智能的瓶颈。”孙仲告诉记者。
正因如此,团队创新性转向了模拟计算这一新兴赛道,成功研制出基于阻变存储器的非负矩阵分解模拟计算求解器。“这就像是为一项特定且繁重的任务,打造了一把高度定制化的‘智能钥匙’,而非继续使用通用的‘万能扳手’。通过精巧的电路设计与算法协同创新,我们在阻变存储器阵列上构建出高度紧凑的模拟电路,并采用原创的电导补偿技术,使得核心计算步骤能够实现‘一步求解’,极大优化了芯片的面积与能耗表现。”孙仲说。
为验证系统性能,研究团队在实验室中成功搭建原型系统,并完成多组实验测试。该系统既完成了对彩色图像的高质量分解,信噪比损失微乎其微;也高效处理了电影推荐数据集训练任务,精度几乎与数字芯片无异。系统级评估显示,在面对网飞规模数据集的推荐系统训练任务时,该模拟求解器的计算速度较先进数字芯片提升约12倍,而能效比更是实现了超过228倍的飞跃性提升。
“这项工作为非负矩阵分解这类约束优化问题的实时求解开辟了新路径,展现了模拟计算处理现实复杂数据的巨大潜力。”孙仲说,“这意味着,未来此类高能效专用芯片,有望大幅提升个性化推荐的实时响应能力,并为生成式AI训练提供更节能、更快的算力支持。”
“这项成果不仅拓展了高效计算架构的应用边界,更为应对人工智能时代的算力挑战提供了创新解决方案。随着后续研究深入和产业化进程推进,此类高能效专用计算架构有望在更多关键领域实现应用,为我国在下一代智能计算技术竞争中构建核心优势。”孙仲期待。
延伸阅读:
华尔街为OpenAI IPO“摸底”,投资机构不待见?
OpenAI距离上市或许还有至少半年时间,但华尔街的预热工作已悄然展开。多家投资银行正主动接触公开市场投资者,试探市场对...
英伟达计划推出名为“NemoClaw”的开源AI智能体平台
英伟达计划推出名为“NemoClaw”的开源AI智能体平台,旨在帮助企业在工作流程中部署能够自主执行任务的AI代理。Ne...
AI预测权威:我还是低估了AI的速度,今年年底实现“AI研发自动化”真的有可能
人工智能能力的跃升速度,正在让最严谨的预测者也措手不及。知名AI预测研究者Ajeya Cotra近日公开承认,她仅在两个...
砺算科技将于3月12日在AWE2026现场举行显卡产品发售会
IT之家 3 月 10 日消息,砺算科技现已宣布,将于 3 月 12 日 14:30~16:30 在 AWE2026 中...
OpenAI继续补全产业版图:宣布收购网安初创公司Promptfoo,增强AI代理安防
智通财经APP获悉,OpenAI周一宣布收购网络安全初创公司Promptfoo。Promptfoo提供用于保护和测试复杂...
