AI编程竞赛:OpenAI Codex赶超Anthropic Claude?

在人工智能编程助手这一赛道,一场激烈的排位赛正在上演。最新数据显示,OpenAI的编程助手Codex在部分核心能力上已超越Anthropic的Claude Code。

10月9日,据初创公司Modu收集的超过30万个代码拉取请求的数据显示,开发者对Codex生成的代码批准率达到了74.3%,略高于Claude Code的73.7%。

这一数据得到了市场的侧面印证,过去一个月,在X和Reddit等社交平台上,已有开发者注意到Codex性能的显著改善。

分析认为,这一逆转主要归功于OpenAI上月发布的GPT-5-Codex模型。据Modu联合创始人Brexton Pham透露,在该模型发布前,OpenAI旧版Codex的代码成功率仅为69%。新模型的推出,成为OpenAI在此次竞赛中扳回一城的关键。

对于Anthropic而言,赢得编码竞赛似乎是意义重大的。据《The Information》报道,该公司的收入主要来自通过API向微软等客户销售其AI模型,而编码技术是其收入的驱动核心。

相比之下,拥有ChatGPT这一商业巨擘的OpenAI对编码业务的收入依赖较小,但其领导层将编码视为开发通用人工智能(AGI)的“关键齿轮”,并于去年加倍投入以提升其模型的编码能力。

性能领先,但用户习惯仍是挑战

尽管在代码生成质量上取得了微弱优势,但Codex在吸引开发者使用方面仍面临巨大挑战。数据显示,在开发者最终合并的代码请求中,使用Codex创建的比例为24.9%,而Claude Code则为32.1%。

不过,Brexton Pham指出,相较于新模型发布前,Codex的市场份额已提升了五个百分点,显示出增长势头。

然而,从另一个维度看,差距依然悬殊。根据软件注册表NPM的数据,Claude Code目前的周下载量超过500万次,而Codex仅为19万次。

这表明,要将性能优势转化为市场主导地位,OpenAI仍有很长的路要走,改变开发者的使用习惯将是其面临的主要障碍。

市场竞争激烈,成本非决定因素

有趣的是,成本似乎并未成为开发者选择工具的首要因素。Brexton Pham表示,尽管Codex比Claude Code更便宜,但开发者目前愿意为高性能产品支付更高价格,因为他们普遍预计长期来看成本会下降。对于企业决策者而言,投资AI编程助手以提升现有工程师效率,远比招聘更多人力工程师的成本要低。

此外,AI编码市场并非只有两家巨头。Modu的数据揭示了一些“黑马”的存在。例如,Sourcegraph公司的Amp agent以76.8%的批准率成为代码最受开发者认可的助手。Brexton Pham将其形容为市场上的“精品奢侈”产品,即价格更高但性能更优。

与此同时,谷歌的Gemini CLI则凭借其一贯的低价策略,成为目前最便宜的编码助手。值得注意的是,Modu的基准测试尚未包含GitHub Copilot和谷歌的Jules agent等重要产品,这意味着整个市场的竞争版图仍有待完整呈现。

暂无介绍....

延伸阅读:

维基的转身:当开放知识遇上AI付费时代

来源:环球网【环球网科技综合报道】在成立25周年之际,维基媒体基金会于1月15日官宣合作,与亚马逊、元宇宙平台公司、微软...

八卦小灵通
2026年1月16日
iPhone 17e曝光:灵动岛加持却暗藏取舍,平价旗舰的平衡术

来源:环球网【环球网科技综合报道】1月16日消息,外媒MacRumors日前披露了iPhone 17e的核心配置信息,这...

娱乐早知道
2026年1月16日
iPhone 18 Pro前瞻:技术革新引领智能手机新纪元

来源:环球网【环球网科技综合报道】距发布尚有8个月,iPhone 18 Pro系列已凭多项重磅升级传闻引发热议。1月16...

八卦小灵通
2026年1月16日
中国天眼揭开宇宙谜团:快速射电暴起源迎来突破性发现

这是来自遥远宇宙的问候——2007年,人类首次发现快速射电暴。那时起,一个谜题始终待解:这个宇宙中最神秘的射电爆发现象之...

八卦小灵通
2026年1月16日
宇宙深处的电波密语:“中国天眼”破译快速射电暴起源之谜

这是1月16日拍摄的“中国天眼”(无人机照片,维护保养期间拍摄)。新华社记者 欧东衢 摄  新华社贵阳1月16日电(记者...

娱乐大事件
2026年1月16日