阿里开源三款中型千问3.5新模型

来源:科技日报

科技日报记者 崔爽

2月25日,继除夕开源Qwen3.5-397B-A17B之后,阿里继续开源千问3.5系列模型。本次开源的三款中等规模的新模型包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B。基于架构创新和训练突破,三款模型均超越了更大尺寸的上代旗舰模型。

据了解,千问3.5模型采用混合注意力机制,结合高稀疏的MoE架构创新,并基于更大规模的文本和视觉混合Token上训练,新模型以更小的总参数和激活参数量,实现了更大的性能提升。

值得注意的是,千问3.5新模型可直接部署于消费级显卡,实现开发者友好。

数据显示,截至目前,阿里已开源千问模型超400个,全球下载量突破10亿次,衍生模型数超20万。同时,除夕开源的Qwen3.5-397B-A17B 模型已登顶Hugging Face全球榜首。

暂无介绍....

延伸阅读:

SpaceX星舰V3完成全时长静态点火测试,首次试飞临近

IT之家 4 月 16 日消息,在得克萨斯州星舰基地完成全时长静态点火测试后,SpaceX 距离发射下一代星舰又近了一大...

娱乐大事件
2026年4月16日
科大讯飞AI智能鼠标AM50 pro发布,498元

IT之家 4 月 16 日消息,科大讯飞现已在京东上架一款 AI 智能鼠标 AM50pro,其内置 AI 功能、支持星闪...

娱乐大事件
2026年4月16日
荣耀MagicBook 14/16 2026款笔记本发布,国补价5949.15元起

IT之家 4 月 16 日消息,荣耀今日发布了 MagicBook 14/16 2026 款笔记本新品,国补价 5949...

娱乐大事件
2026年4月16日
数据中心绿电直连落地难在成本高,需从新型电力系统构建出发

“绿电直连”以负荷主体为中心,由可再生能源通过直连线路,向单一电力用户供给绿电,用于满足其负荷需求,当前备受关注。据国家...

娱乐大事件
2026年4月16日
腾讯混元3D世界模型2.0发布 一句话生成3D资产

快科技4月16日消息,今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。官方表示,该模型一句话...

八卦小灵通
2026年4月16日