OpenAI 推出 GPT-5.1-Codex-Max 编程模型:可 “通宵” 处理任务,性能跑分超越谷歌

来源:环球网

【环球网科技综合报道】11月20日消息,据VentureBeat报道,OpenAI昨日正式发布新一代智能体编程模型GPT-5.1-Codex-Max,该模型在长远推理、工作效率及实时交互能力上实现显著提升,将取代GPT-5.1-Codex成为Codex集成界面的默认模型,为全球开发者带来更高效的编程辅助体验。

作为OpenAI在编程模型领域的重要升级产品,GPT-5.1-Codex-Max在多项关键编程基准测试中表现亮眼。在衡量实际软件问题解决能力的SWE-Bench Verified测试中,其准确率达到77.9%,小幅领先于谷歌Gemini 3 Pro的76.2%;在Terminal-Bench 2.0测试中,以58.1%的准确率优于Gemini 3 Pro的54.2%;而在竞争激烈的LiveCodeBench Pro编码Elo基准测试中,该模型与Gemini 3 Pro的2439分持平,展现出强劲的综合性能。

此次模型升级的核心亮点是引入“压缩”(Compaction)机制。这一创新架构允许模型在接近上下文窗口限制时,智能保留关键信息并丢弃无关细节,实现了跨越数百万token的连续工作而不降低性能。依托该机制,模型在内部测试中成功完成了持续超过24小时的复杂任务,包括多步骤代码重构和自主调试,同时token效率提升约30%,有效降低了开发成本与响应延迟。

目前,GPT-5.1-Codex-Max已集成到OpenAI旗下多个Codex开发环境,涵盖官方命令行工具(Codex CLI)、内部代码审查工具及各类交互式编程环境。开发者可通过这些工具体验强化学习训练可视化、光学定律模拟等实时交互功能。该模型暂未通过公共API开放,官方表示后续将逐步推进,普通用户需订阅ChatGPT Plus、Pro或企业版等付费计划使用。

据OpenAI透露,其内部95%的工程师每周都会使用Codex系列工具,自采用以来,工程师平均拉取请求(Pull Requests)提交量提升约70%,开发效率显著提高。针对模型的自主性应用,OpenAI明确强调其定位为编码“助手”而非人类替代品。为保障开发安全与透明度,模型会生成详细的终端日志和测试引用,方便开发者审查验证代码,且默认运行于严格的沙盒环境,禁用网络访问以防范安全风险。(纯钧)

暂无介绍....

延伸阅读:

英伟达营收创新高,黄仁勋称AI已到拐点

2026.02.26本文字数:2069,阅读时长大约3分钟作者 |第一财经 郑栩彤当地时间2月25日,英伟达发布截至20...

八卦小灵通
2026年2月26日
用一生研究核武器 他一封公开信召唤万千学子归国

来源:央视新闻客户端“我们中国要出头的我们的民族再也不是一个被人侮辱的民族了!我们已经站起来了回去吧赶快回去吧!祖国在迫...

八卦小灵通
2026年2月26日
锂电、存储等迎催化:津巴布韦锂矿出口受限,存储芯片巨头计划扩产|盘前情报

昨日A股2月25日,市场高开高走,午后小幅回落后再度拉升,创业板指、深成指均涨超1%。截至收盘,沪指涨0.72%,深成指...

娱乐早知道
2026年2月26日
阿里云推出低价AI编程套餐 集成四大顶级开源模型

阿里云在软件开发领域发起价格战,推出集成四大顶级开源大模型的低价AI编程订阅服务,旨在以极低门槛争夺开发者市场,并加速其...

娱乐大事件
2026年2月26日
Anthropic放弃标志性“安全护栏”承诺

曾以“负责任AI”为最高使命的Anthropic宣布放宽其安全研发限制,Anthropic更新了规则,宣布如果未能保持对...

娱乐早知道
2026年2月26日