DeepSeek新模型曝光：MODEL1代码预示新架构，最快有望2月发布

娱乐早知道
科技前沿
2026年1月21日

IT之家 1 月 21 日消息，The Information 月初爆料称，DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4，将具备更强的写代码能力。

1 月 20 日，正值 DeepSeek-R1 发布一周年之际，有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码，横跨 114 个文件中有 28 处都提到了未知的“MODEL1”大模型标识符。

该标识符与已知的现有模型“V32”（即 DeepSeek-V3.2）被并列或区别提及。根据代码上下文分析，“MODEL1”很可能代表一个不同于现有架构的新模型。

开发者分析认为，“MODEL1”与“V32”在关键技术上存在区别，主要体现在键值（KV）缓存的布局、稀疏性处理方式以及对 FP8 数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。

此前，DeepSeek 研究团队还陆续发布了两篇技术论文，分别介绍了名为“优化残差连接（mHC）”的新训练方法，以及一种受生物学启发的“AI 记忆模块（Engram）”。这一举动不禁引起用户猜测，DeepSeek 正在开发中的新模型有可能会整合这些最新的研究成果。敬请期待。

#deepseek #model #上下文 #代码 #实时世界模型 #标识符

娱乐早知道

暂无介绍....

上一篇

阿联酋G42 CEO：英伟达、AMD等先进AI芯片将在数月内运抵阿联酋

下一篇

马斯克xAI又一位联合创始人离开，杨格宣布因病离职

延伸阅读:

HUDIMM DDR5内存性能初探，带宽性能腰斩近50%

科技前沿

HUDIMM DDR5内存性能初探，带宽性能腰斩近50%

IT之家 4 月 21 日消息，科技媒体 Wccftech 昨日（4 月 20 日）发布博文，测试 DDR5 HUDIM...

摸鱼小能手 2026年4月21日

瑞银评智谱–“中国版Anthropic”

科技前沿

瑞银评智谱–“中国版Anthropic”

一家清华系AI公司，正在走一条与全球头部AI实验室高度相似的路。4月20日，瑞银Wei Xiong等分析师发布了一份近4...

娱乐大事件 2026年4月21日

月之暗面发布K2.6，杨植麟真的需要一个郭达雅

科技前沿

月之暗面发布K2.6，杨植麟真的需要一个郭达雅

月之暗面发布了Kimi K2.6，这也是杨植麟的第一个X.6版本。虽然版本号上只加了0.1，但这不是一次普通的版本更新。...

娱乐大事件 2026年4月21日

爱奇艺再回应AI艺人库

科技前沿

爱奇艺再回应AI艺人库

2026.04.21本文字数：576，阅读时长大约1分钟4月21日凌晨，@爱奇艺再次发文重申在AIGC影视创作领域的坚...

娱乐早知道 2026年4月21日

爱奇艺急转弯要“去中心化”，做AI艺人库却被观众说“疯了”

科技前沿

爱奇艺急转弯要“去中心化”，做AI艺人库却被观众说“疯了”

（图源：视觉中国）蓝鲸新闻4月21日讯（记者彭乐怡）"实拍剧不知道过多少年，会被命名为非物质文化遗产。"爱奇艺CEO龚...

娱乐大事件 2026年4月21日