DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破
21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。
V3.1版本的核心亮点是采用了全新的混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。
据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。
DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。
混合推理架构,迈向Agent时代
据DeepSeek官网,本次升级包含以下主要变化:
延伸阅读:
全面提升生产力:初探苹果 iPadOS 26 多任务体验,操作更像 Mac
IT之家 9 月 18 日消息,科技媒体 MacRumors 昨日(9 月 17 日)发布博文,并分享了一段演示视频,介...
猛士系列商标引入新合资公司,东风与华为升级合作
在岚图即将独立上市之际,东风汽车旗下另一自主品牌猛士也有了新动向。9月17日晚间,东风集团股份(00489.HK)官宣与...
科济药业-B(02171)于2025年第22届IMS年会上呈列的赛恺泽®的研究成果更新
智通财经APP讯,科济药业-B(02171)发布公告,赛恺泽®(泽沃基奥仑赛注射液,产品编号: CT053,一种靶向BC...
“董明珠健康家”半年开970家 英伟达被调查|通讯Plus·早报
“董明珠健康家”半年开970家 非空调品类销量上升格力官方消息显示,截至目前“董明珠健康家”在全国已建设970家门店。其...
连续视频播放测试:苹果 iPhone Air 成绩 6 小时 43 分
IT之家 9 月 18 日消息,YouTube 频道 The Tech Chap 在最新一期视频中,评测了 iPhone...