OpenAI推出macOS版Codex应用:整合智能体化开发逻辑

IT之家 2 月 3 日消息,人工智能已然对软件开发的方式产生颠覆性影响,如今编程中大量繁重琐碎的工作,都由一众智能体与子智能体完成。但开发者们仍在不断探索人机协作的全新交互界面与产品形态,即便最顶尖的人工智能实验室,也难以跟上这一迭代节奏。

据IT之家了解,当下的主流趋势是智能体化软件开发,即人工智能智能体可独立完成编码任务的系统,Claude Code 与 Cowork 这类应用便是该模式的典型代表。与此同时,OpenAI 也在逐步完善其 Codex 工具,该工具于去年 4 月以命令行工具的形式推出,一个月后便拓展出网页端界面。

如今 OpenAI 正式迈出追赶的关键一步。当地时间本周一,该公司推出了适配 macOS 系统的全新 Codex 应用,整合了过去一年间广泛流行的各类智能体化开发逻辑。这款新应用支持多智能体并行作业,可融合不同智能体的能力,以及当前最前沿的工作流程。此次发布距离 OpenAI 推出其最强编码大模型 GPT-5.2-Codex,尚不足两个月,公司希望凭借该模型吸引 Claude Code 的用户。

OpenAI 首席执行官萨姆・奥尔特曼在媒体电话发布会中表示:“若要处理复杂场景下的高精尖开发工作,GPT-5.2 是目前性能最强的模型。但它此前的使用门槛偏高,因此我们认为,将这款模型的强大能力封装进更灵活的交互界面,会具备极为重要的价值。”

尽管奥尔特曼对 GPT-5.2 充满信心,但各类编码基准测试的结果却呈现出更复杂的态势。截至发稿,GPT-5.2 在 TerminalBench(一项衡量人工智能处理命令行编程任务能力的测试)中暂居榜首,不过 Gemini 3 与 Claude Opus 的智能体得分与其基本持平(数值略低),处于该基准测试的误差允许范围内。另一项测试人工智能修复真实软件漏洞能力的基准测试 SWE-bench,结果也与之相似,GPT-5.2 并未展现出明显优势。不过,智能体化的应用场景很难通过现有基准进行有效评估,且顶尖模型在用户体验上的差异可能十分显著。

这款 Codex 应用还搭载了多项全新功能,这些功能将帮助其达到与各类 Claude 应用相当的水平,部分场景下甚至实现反超。应用支持设置自动化任务,可按预设计划在后台自动运行,执行结果会存入队列,待用户返回后统一查看。用户还能根据自身工作风格,为智能体选择不同交互风格,从务实理性型到共情沟通型均可切换。

但对 OpenAI 而言,这款产品最大的核心卖点,是人工智能带来的极致开发效率。奥尔特曼称:“你可以从零开始,仅凭这款工具,在数小时内开发出功能相当复杂的软件。我能多快输入新的创意,软件的开发速度就有多快,这便是唯一的限制。”

暂无介绍....

延伸阅读:

环球问策之AI篇:从“人工”到“智能” AI Agent如何颠覆出海营销的底层逻辑?

来源:环球网【环球网科技报道 记者 李文瑶】“面对全球化复杂性指数级增长、增长引擎失速及决策智能断层等多重挑战,传统营销...

娱乐早知道
2026年3月20日
2027年互联网AI机器人流量要超人类?Cloudflare CEO发声

IT之家 3 月 20 日消息,据科技媒体 TechCrunch 昨天报道,Cloudflare 首席执行官 Matth...

娱乐大事件
2026年3月20日
大型无人货运飞机W5000藏着哪些黑科技?一文揭秘

来源:央视新闻客户端“十五五”规划纲要提出,培育发展低空装备等新产业新赛道。目前,我国在研载重最大的无人货运飞机W500...

娱乐早知道
2026年3月20日
MiniMax M2.7国服第一!龙虾自我进化,海外开发者疯狂刷屏

【新智元导读】MiniMax M2.7刷屏海外开发者社区,热度直冲榜单前列!多智能体协作+自进化能力引爆关注,它为何让全...

娱乐早知道
2026年3月20日
浙江入选8个全国优秀实践案例,数量全国第一

据浙江发布3月20日消息,近日,商务部正式发布2025年跨境电商优秀实践案例,全国共有30个案例入选。浙江共有8个典型案...

八卦小灵通
2026年3月20日