Claude Sonnet 4.5 发布，登顶编程测试，可连续工作超 30 小时

八卦小灵通
科技前沿
2025年9月30日

Anthropic 发布 Claude Sonnet 4.5，性能大幅提升。在 SWE-bench Verified 测试中，Claude Sonnet 4.5 登顶业界第一，且能连续专注工作超 30 小时。它可一次性敲出约 1.1 万行代码，构建复杂智能体、操作电脑、推理和数学等能力大幅提升。在 OSWorld 测试中拿下 61.4% 的成绩。

Claude Chrome 插件可像真人一样在浏览器里操作任务。Claude Code 新增「检查点」功能，终端界面翻新，发布原生 VS Code 插件。Claude API 增加上下文编辑功能和记忆工具，代码执行和文件创建整合到对话里。Anthropic 还开放了 Claude Agent SDK，供开发者构建自己的产品。

Claude Sonnet 4.5 定价与 Claude Sonnet 4 一致，每百万 tokens 3/15 美元。网友体验后评价其重构代码库表现优雅但结果无法运行。Cursor 认为其在处理长周期任务时提升明显，Dan Shipper 表示新版本响应速度更快、可控性更强、更稳定。

Claude Sonnet 4.5 是 Anthropic 到目前为止对齐度最高的前沿模型，减少了不良行为，在防御提示注入攻击和减少内容误判方面有重大突破。同时推出「Imagine with Claude」临时研究预览功能，但仅对 Max 订阅用户开放五天。

Anthropic 估值达 1830 亿美元，8 月年化营收 50 亿美元，但面临 OpenAI 和 Google Gemini 的竞争压力。此前 Claude 系列模型曾经历「降智」风波，此次发布 Claude Sonnet 4.5 是为挽回用户，其实际表现还需后续观察。

#claude #sonnet #代码 #插件 #深度思考按钮 #编程测试

八卦小灵通

暂无介绍....

医械网	工业品资讯
广告位	广告位

Claude Sonnet 4.5 发布，登顶编程测试，可连续工作超 30 小时

八卦小灵通

纯电动乘用车出海需获许可，汽车出口从拼数量到拼质量

iPhone 16e机密设计原理图泄露：163页文件曝光芯片细节

延伸阅读:

大众美国CEO格鲁纳称轿车和掀背车仍有未来：这是品牌的“心跳”

奔驰电动旗舰EQS二次改款在即，将改用线控转向、异形方向盘

我们还能在使用AI创作时，进入心流吗？

北京信息光电子芯片平台预计今年6月产线贯通

谷歌发布Gemma 4开源大模型，31B参数性能达头部水准