DeepSeek-V3.1正式发布:更强的Agent能力
今日,DeepSeek官方官宣DeepSeek-V3.1正式发布。
据介绍,本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
编程智能体:在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。
搜索智能体:DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。
测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。
此外,从9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行如下调整。
延伸阅读:
科技昨夜今晨0122:工信部称将扩大“二次号码焕新”覆盖范围
“科技昨夜今晨”时间,大家好,现在是 2026 年 1 月 22 日星期四,今天的重要科技资讯有:1、OPPO Find...
iPhone 17等苹果用户反馈iOS存储空间消耗速度显著加快
IT之家 1 月 22 日消息,科技媒体 Cult of Mac 昨日(1 月 21 日)发布博文,指出 iPhone ...
美国总统亲自“割韭菜”,特朗普币一年跌94%!
特朗普推出的加密货币从巅峰时期暴跌超过90%,高位买入的投资者正承受巨额损失。去年1月,特朗普就职前夕推出的特朗普代币,...
商业航天爆发,谁为失败“兜底”?航天保险10年已提供超300亿保障
商业航天正逐步成为我国航天体系中的关键组成部分。不过,在商业航天发射频次和任务规模扩大的同时,风险也逐步显现。1月17日...
华泰证券:德国电动车补贴利好锂电产业链
人民财讯1月22日电,华泰证券研报称,德国政府1月19日宣布,联邦政府气候与转型基金拨款30亿欧元,对新购入电动汽车的家...
