OpenAI发布GPT-5.2-Codex:号称工程实战能力天花板

OpenAI刚刚正式发布GPT-5.2-Codex,主要针对专业软件工程和防御性网络安全优化的智能体(Agentic)编程模型。相比前代,它在长程任务处理、大规模代码重构、Windows环境适配以及网络安全能力上均有显著提升,工程能力达到实战天花板

目前,付费ChatGPT用户已可在Codex相关界面体验,API访问也将在未来几周内开启。开发者可以通过以下命令安装:

$ npm i -g @openai/codex

GPT-5.2-Codex是在GPT-5.2的基础上,吸收了GPT-5.1-Codex-Max的智能体与终端使用能力进一步优化而来

其核心技术改进包括:

上下文压缩:增强了长程任务的处理能力,使其在大型仓库中进行跨长时间周期的协作时,能保持全上下文完整,不丢失进度

复杂工程处理:在处理大规模代码重构、代码迁移和功能构建时更具可靠性,即使计划变更或尝试失败,模型也能持续迭代

性能表现:在SWE-Bench Pro(软件工程任务评测)和Terminal-Bench 2.0(真实终端环境评测)中均达到了SOTA(业内顶尖)水平

环境适配:显著提升了在原生Windows环境下的智能体编程效率与稳定性

视觉增强:模型能更准确地理解屏幕截图、技术架构图和UI界面,支持直接将设计稿生成为可运行的原型

OpenAI表示,GPT-5.2-Codex的发布是AI支持复杂软件工程和专业安全领域的关键一步,未来将根据发布反馈持续扩展访问权限

具体表现如何,还是要看结合自己的使用才知道

暂无介绍....

延伸阅读:

从割裂的国别电信市场到整合为统一的“超级单一市场”欧盟推新法案为人工智能发展铺路

原标题:从割裂的国别电信市场到整合为统一的“超级单一市场”欧盟推新法案为人工智能发展铺路自欧盟委员会1月21日正式提出《...

娱乐大事件
2026年2月2日
美国宇航局(NASA)开始进行载人绕月飞行前的关键测试

IT之家 2 月 2 日消息,据央视新闻报道,当地时间 1 月 31 日,美国宇航局(NASA)开始为期两天的模拟倒计时...

娱乐大事件
2026年2月2日
雷军:新一代SU7研发测试已完成,春节前展车陆续到店

昨日雷军在直播中表示新一代SU7上市前的研发测试工作已完成。预计2月13号开始,新一代SU7展车会陆续在北京、上海、深圳...

娱乐大事件
2026年2月2日
2026新春走基层|追光者的“星愿”

1月30日,在长光卫星技术股份有限公司(以下简称“长光卫星”),记者与一场“超时空观测”不期而遇。看着长春冰雪新天地被数...

八卦小灵通
2026年2月2日
比亚迪2026年1月新能源汽车销量同比下降30.11%,纯电动汽车销量同比下降33.60%

2月1日,比亚迪(002594.SZ)发布2026年1月产销快报。数据显示,2026年1月比亚迪实现新能源汽车销量210...

八卦小灵通
2026年2月2日