OpenAI最强AI智能体编程模型:GPT-5.3-Codex登场

IT之家 2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。

IT之家附上相关基准测试结果如下:

在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%;在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%;最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中,得分从 38.2% 飙升至 64.7%,表明其在复杂环境下的操作能力实现了质的飞跃。官方数据显示,该模型不仅在多项编程基准测试中创下新高,运行速度也比前代 GPT-5.2-Codex 提升了 25%。

OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。

在 Codex 应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex 正从单一的编程智能体演变为更通用的计算机协作者,大幅降低了构建应用的门槛。

GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放,涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问,API 版本也将在近期上线。

暂无介绍....

延伸阅读:

总不能山姆的什么锅都让阿里背吧

作者 | 源Sight 王言先是被曝强制要求员工卖卡,后又被永辉超市喊话停止"二选一",近期的山姆争议不断。近日,永辉旗...

娱乐大事件
2026年3月25日
谷歌为Chrome浏览器发布安全更新,修复8项高危安全漏洞问题

IT之家 3 月 25 日消息,Google 谷歌当地时间本周一宣布向 Chrome 网络浏览器桌面版稳定频道推送安全更...

娱乐大事件
2026年3月25日
三星Galaxy Z Fold8折叠手机渲染图曝光:外6.5/内8英寸屏幕

IT之家 3 月 25 日消息,科技媒体 Android Headline 昨日(3 月 24 日)发布博文,分享了一组...

娱乐早知道
2026年3月25日
你是否在雪山救过一只狐狸?

最近,很多人打开短视频平台,会刷到这样一个问题:你是否在雪山救过一只狐狸?然后被各种“二创脑洞”,带入反转反转再反转的搞...

娱乐早知道
2026年3月25日
1元买软件、5元买服务 配音演员声音是如何被批量“偷走”的?

“臣妾做不到啊”——这句话,你可能听过无数次,却未必知道,说这话的声音,正在被AI批量贩卖。从《甄嬛传》里的甄嬛,到《无...

八卦小灵通
2026年3月25日