寒武纪已适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM-MLU

IT之家 9 月 30 日消息,DeepSeek 昨日正式发布了 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。IT之家注意到,寒武纪当天宣布,已同步实现对深度求索公司最新模型 DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎 vLLM-MLU 源代码。

寒武纪称,一直高度重视大模型软件生态建设,支持以 DeepSeek 为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对 DeepSeek-V3.2-Exp 这一全新实验性模型架构的 day 0 适配和优化。

针对本次的 DeepSeek-V3.2-Exp 新模型架构,寒武纪通过 Triton 算子开发实现了快速适配,利用 BangC 融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。依托 DeepSeek-V3.2-Exp 带来的全新 DeepSeek Sparse Attention 机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。

vLLM-MLU DeepSeek-V3.2-Exp 适配的源码:

暂无介绍....

延伸阅读:

AMD AFMF 3 插帧技术曝光,游戏帧数有望再迎飞跃

IT之家 9 月 30 日消息,科技媒体 TechPowerUp 今天(9 月 30 日)发布博文,报道称在 25.20...

八卦小灵通
2025年9月30日
传Verizon(VZ.US)正洽谈收购回声星通信(SATS.US)无线频谱资产

智通财经APP获悉,据知情人士透露,Verizon Communications Inc.(VZ.US)正与回声星通信(...

八卦小灵通
2025年9月30日
寒武纪已适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM-MLU

IT之家 9 月 30 日消息,DeepSeek 昨日正式发布了 DeepSeek-V3.2-Exp 模型,这是一个实验...

娱乐早知道
2025年9月30日
OpenAI被曝将推出“AI版TikTok”,所有短视频内容均为AI生成

IT之家 9 月 30 日消息,据《连线》杂志 29 日报道,OpenAI 正计划推出一款独立社交应用,其由即将上线的 ...

八卦小灵通
2025年9月30日
美国加州里程碑式 AI 透明度法案生效

IT之家 9 月 30 日消息,作为备受关注的人工智能(AI)透明度法案,美国加州参议院第 53 号法案(SB 53)数...

摸鱼小能手
2025年9月30日