DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破

21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。

V3.1版本的核心亮点是采用了全新的混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。

据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。

DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。

混合推理架构,迈向Agent时代

据DeepSeek官网,本次升级包含以下主要变化:

暂无介绍....

延伸阅读:

纯电时代的家庭出行新旗舰:斯柯达Peaq七座SUV即将登场

IT之家 1 月 14 日消息,当地时间 1 月 13 日,据外媒 Carscoops 报道,斯柯达揭晓了旗下首款纯电七...

娱乐大事件
2026年1月14日
透明木窗:自然调控光线与温度的绿色建材新突破

IT之家 1 月 14 日消息,韩国研究人员近日开发出一种基于木材的新型复合材料,无需用电即可根据环境温度自动调节透光率...

八卦小灵通
2026年1月14日
中国获准进口英伟达H200芯片:AI算力格局迎来新变局

IT之家 1 月 14 日消息,据央视新闻报道,当地时间 1 月 13 日,美国政府批准英伟达向中国出口其人工智能芯片 ...

八卦小灵通
2026年1月14日
长八甲火箭刷新发射效率纪录:18天完成全流程测试

据中国航天科技集团官微1月14日消息,1月13日23时25分,长征八号甲运载火箭在海南商业航天发射场点火升空,随后将卫星...

摸鱼小能手
2026年1月14日
联讯仪器上市背后:代持谜团与财务数据矛盾浮出水面

来源:环球网【环球网财经综合报道】苏州联讯仪器股份有限公司是国内领先的高端测试仪器设备企业,主营业务为电子测量仪器和半导...

摸鱼小能手
2026年1月14日