DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破
21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。
V3.1版本的核心亮点是采用了全新的混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。
据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。
DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。
混合推理架构,迈向Agent时代
据DeepSeek官网,本次升级包含以下主要变化:
延伸阅读:
三星Galaxy S26 Ultra设计革新曝光:圆润机身回归与影像系统全面进化
IT之家 12 月 31 日消息,消息源 @Onleaks 昨日(12 月 30 日)在 X 平台发布推文,分享了一段视...
未来之基:2025中国AI创新全景图谱
1硅星人 2025「年度平台技术榜」这是托住 AI 创作者与开发者底层想象力的一组名字——从算力、模型到工具链,它们不在...
生命探索的黄金时代:地球隐藏版图正被揭开
来源:科技日报科技日报记者 张梦然一项最新研究显示,地球“生命图谱”远未完整,而今正迎来物种发现的“黄金时代”:美国亚利...
宇宙初生之谜揭晓:氘核诞生于高能火球的瞬息衰变
来源:科技日报科技日报记者 刘霞德国慕尼黑工业大学等机构科学家借助欧洲核子研究中心大型强子对撞机(LHC)的内部碰撞,揭...
安卓最大免费开源应用仓库F-Droid完成“换心”,实现一天两更
IT之家 12 月 31 日消息,科技媒体 NeoWin 昨日(12 月 30 日)发布博文,报道称安卓平台上最大的免费...
