阿里开源新架构Qwen3-Next，模型训练成本降9成，长文本推理吞吐提升10倍

娱乐早知道
科技前沿
2025年9月12日

每经杭州9月12日电（记者叶晓丹）9月12日，阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展（Scaling）的未来趋势而设计，采用全新的高稀疏MoE架构，并对经典Transformer核心组件进行了重构，创新采用线性注意力和自研门控注意力结合的混合注意力机制，实现了模型训练和推理的双重性价比突破。

基于这一新架构，阿里通义“打样”了Qwen3-Next-80B-A3B系列模型，开源指令（Instruct）和推理（Thinking）两大模型版本。新模型总参数80B仅激活3B，性能可媲美千问3旗舰版235B模型，模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%，长文本推理吞吐量提升10倍以上，并可支持百万Tokens（文本处理的最小单位‌）超长上下文。

#qwen #上下文 #推理 #深度思考模型 #阿里巴巴集团

娱乐早知道

暂无介绍....

上一篇

E句话| 乃万称目前单身

下一篇

37岁于朦胧坠楼去世，“天选古人”永远定格

延伸阅读:

突破HBM容量限制：铠侠宣布推出超高IOPS SSD，让GPU直连闪存

科技前沿

突破HBM容量限制：铠侠宣布推出超高IOPS SSD，让GPU直连闪存

IT之家 3 月 17 日消息，铠侠今日亮相 NVIDIA GTC 2026 大会，并宣布推出一种全新类型的 SSD 产...

八卦小灵通 2026年3月17日

李彦宏牵头的AI生命科学公司赴港上市；永辉公开喊话山姆丨邦早报

科技前沿

李彦宏牵头的AI生命科学公司赴港上市；永辉公开喊话山姆丨邦早报

【黄仁勋狂扔“核弹”：1万亿营收、LPU、太空芯片、一键“养虾”】北京时间今日凌晨，“AI春晚”英伟达年度GTC大会拉开...

娱乐大事件 2026年3月17日

高盛快评黄仁勋GTC讲话：满足了投资者两项关键预期

科技前沿

高盛快评黄仁勋GTC讲话：满足了投资者两项关键预期

英伟达首席执行官黄仁勋在GTC 2026大会上的主题演讲释放出强劲的长期增长信号，成功满足了市场对算力需求前景和推理市场...

娱乐早知道 2026年3月17日

GTC2026｜美光科技开始为英伟达量产HBM4内存，速率比上一代HBM3E提升约2.3倍

科技前沿

GTC2026｜美光科技开始为英伟达量产HBM4内存，速率比上一代HBM3E提升约2.3倍

3月17日，在今天凌晨进行的英伟达 GPU 技术大会（GTC）中，美光宣布旗下多款存储产品已同步进入大规模量产阶段，这些...

娱乐大事件 2026年3月17日

英伟达发布“太空算力模块”，“太空版” Vera Rubin后续将推出

科技前沿

英伟达发布“太空算力模块”，“太空版” Vera Rubin后续将推出

英伟达正将其AI计算版图延伸至地球轨道。在隔夜GTC年度开发者大会上，英伟达宣布推出面向太空场景的专用计算模块，并披露了...

摸鱼小能手 2026年3月17日