DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破
21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。
V3.1版本的核心亮点是采用了全新的混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。
据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。
DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。
混合推理架构,迈向Agent时代
据DeepSeek官网,本次升级包含以下主要变化:
延伸阅读:
灵魂社交平台Soul四次冲击上市,能否成功突围?
12 月 10 日消息,一家从“灵魂社交”起家的 App,折腾将近十年,终于再次站在了最接近成功上市的关口。它就是—— ...
人工智能时代反不正当竞争司法协作倡议发布
12月6日,第七届自贸区知识产权司法保护浦东论坛——“人工智能时代反不正当竞争法前沿问题”研讨会暨上海市法学会知识产权法...
AI安全边界再探讨!第九届南都啄木鸟数据治理论坛即将启幕
回望2025年,年初DeepSeek火热出圈点燃全球科技圈的热情、人形机器人赛道竞争升级、AI眼镜和AI手机等智能终端百...
太空数据中心:AI算力的新战场正在崛起
Gavin Baker认为太空数据中心将成为未来三到四年最重要的技术突破。12月9日,资深科技投资者Gavin Bake...
浦东新增自动驾驶测试道路,加速智能出行布局
记者从近日举行的“‘人工智能+交通运输’上海发布 2025”活动上获悉,浦东新区新增1439条、2113.78公里自动驾...
