阿里开源三款中型千问3.5新模型

来源:科技日报

科技日报记者 崔爽

2月25日,继除夕开源Qwen3.5-397B-A17B之后,阿里继续开源千问3.5系列模型。本次开源的三款中等规模的新模型包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B。基于架构创新和训练突破,三款模型均超越了更大尺寸的上代旗舰模型。

据了解,千问3.5模型采用混合注意力机制,结合高稀疏的MoE架构创新,并基于更大规模的文本和视觉混合Token上训练,新模型以更小的总参数和激活参数量,实现了更大的性能提升。

值得注意的是,千问3.5新模型可直接部署于消费级显卡,实现开发者友好。

数据显示,截至目前,阿里已开源千问模型超400个,全球下载量突破10亿次,衍生模型数超20万。同时,除夕开源的Qwen3.5-397B-A17B 模型已登顶Hugging Face全球榜首。

暂无介绍....

延伸阅读:

中邮证券:全球量子科技产业化加速推进中 多路线突破与PQC迁移成焦点

智通财经APP获悉,中邮证券发布研报称,截至2025年,全球30多国投入超350亿美元布局量子科技,我国“十五五”规划将...

娱乐早知道
2026年2月27日
工信部:春节期间扩容超26万个4G和5G基站

快科技2月27日消息,工业和信息化部消息显示,2026年春节假期,按需扩容超26万个4G和5G基站,全国通信网络实现平稳...

娱乐早知道
2026年2月27日
何小鹏:中国在VLA上成功的只有我们 将比所有第一阵营强至少10倍

快科技2月27日消息,小鹏汽车的智能辅助驾驶曾经无疑是中国第一梯队,然而随着AI时代的来临,小鹏的长板逐渐被后来者陆续超...

摸鱼小能手
2026年2月27日
谷歌新模型Nano Banana 2来了;手机厂商或集中涨价

21世纪经济报道新质生产力研究院综合报道早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来...

娱乐大事件
2026年2月27日
美团推出“饭团漫社”,布局漫剧赛道

来源| Tech星球文| 陈桥辉Tech星球独家获悉,美团于近期在主App内上线了漫剧板块“饭团漫社”,板块内不仅涵盖常...

娱乐大事件
2026年2月27日