寒武纪已适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM-MLU
IT之家 9 月 30 日消息,DeepSeek 昨日正式发布了 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。IT之家注意到,寒武纪当天宣布,已同步实现对深度求索公司最新模型 DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎 vLLM-MLU 源代码。
寒武纪称,一直高度重视大模型软件生态建设,支持以 DeepSeek 为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对 DeepSeek-V3.2-Exp 这一全新实验性模型架构的 day 0 适配和优化。
针对本次的 DeepSeek-V3.2-Exp 新模型架构,寒武纪通过 Triton 算子开发实现了快速适配,利用 BangC 融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。依托 DeepSeek-V3.2-Exp 带来的全新 DeepSeek Sparse Attention 机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。
vLLM-MLU DeepSeek-V3.2-Exp 适配的源码:
延伸阅读:
中国工程院院士刘经南:让北斗星光点亮千行百业,需做好区域与行业协同大文章
人民财讯4月1日电,4月1日,证券时报“人民财讯·大观”栏目专访中国工程院院士、武汉大学教授、国家卫星定位系统工程技术研...
中国工程院院士刘经南:北斗不是“中国版GPS”,它能力独特、应用广泛
人民财讯4月1日电,4月1日,证券时报“人民财讯·大观”栏目专访中国工程院院士、武汉大学教授、国家卫星定位系统工程技术研...
集邦咨询预估2026全球笔记本出货量同比降14.8%
IT之家 4 月 1 日消息,集邦咨询 trendforce 于 3 月 30 日发布报告,下调 2026 年全球笔记本...
苹果为AirPods Max 2耳机推送固件更新,版本号8E251
IT之家 4 月 1 日消息,苹果今日为 AirPods Max 2 头戴耳机推送了全新固件,固件版本号为 8E251。...
特斯拉确认Robotaxi特定情况下将由人工远程接管:系“最后手段”
IT之家 4 月 1 日消息,特斯拉承认,其 Robotaxi 并非完全由系统独立运行,在特定情况下仍会由远程人工接管。...
