Claude Sonnet 4.5 发布,登顶编程测试,可连续工作超 30 小时

Anthropic 发布 Claude Sonnet 4.5,性能大幅提升。在 SWE-bench Verified 测试中,Claude Sonnet 4.5 登顶业界第一,且能连续专注工作超 30 小时。它可一次性敲出约 1.1 万行代码,构建复杂智能体、操作电脑、推理和数学等能力大幅提升。在 OSWorld 测试中拿下 61.4% 的成绩。

Claude Chrome 插件可像真人一样在浏览器里操作任务。Claude Code 新增「检查点」功能,终端界面翻新,发布原生 VS Code 插件。Claude API 增加上下文编辑功能和记忆工具,代码执行和文件创建整合到对话里。Anthropic 还开放了 Claude Agent SDK,供开发者构建自己的产品。

Claude Sonnet 4.5 定价与 Claude Sonnet 4 一致,每百万 tokens 3/15 美元。网友体验后评价其重构代码库表现优雅但结果无法运行。Cursor 认为其在处理长周期任务时提升明显,Dan Shipper 表示新版本响应速度更快、可控性更强、更稳定。

Claude Sonnet 4.5 是 Anthropic 到目前为止对齐度最高的前沿模型,减少了不良行为,在防御提示注入攻击和减少内容误判方面有重大突破。同时推出「Imagine with Claude」临时研究预览功能,但仅对 Max 订阅用户开放五天。

Anthropic 估值达 1830 亿美元,8 月年化营收 50 亿美元,但面临 OpenAI 和 Google Gemini 的竞争压力。此前 Claude 系列模型曾经历「降智」风波,此次发布 Claude Sonnet 4.5 是为挽回用户,其实际表现还需后续观察。

暂无介绍....

延伸阅读:

高速惊魂!特斯拉续航剩72公里突然断电,售后:续航剩100公里就该充电;欣旺达电池翻车!极氪召回超3.8万辆车;高德打车被约谈整改

要闻提示1.高速惊魂!特斯拉续航剩72公里突然断电,售后回应:续航剩100公里就该充电2.欣旺达电池翻车!东风奕派碰撞5...

娱乐早知道
2026年2月11日
ChatGPT上线车险比价神器

周一,美国在线保险代理和比较平台Insurify正式发布ChatGPT保险比价应用,用户能够在ChatGPT的应用库直接...

娱乐大事件
2026年2月11日
和夏科技递表港交所 金联资本为独家保荐人

和夏科技向港交所创业板递交上市申请,金联资本为其独家保荐人。根据弗若斯特沙利文报告,公司已发展成为浙江省领先的汽车测试解...

八卦小灵通
2026年2月11日
安徽首个居民V2G充电桩并网投运

原标题:全省首个居民V2G充电桩并网投运2月9日,在合肥市葛洲坝·玖珑府小区,市民夏祺通过手机控制,完成了自家新能源汽车...

娱乐大事件
2026年2月11日
河南“信号升格”成绩单出炉:7.9万场所信号升级 5G-A基站达1.45万个

原标题:河南“信号升格”成绩单出炉:7.9万场所信号升级 5G-A基站达1.45万个2月10日,记者从河南省通信管理局获...

娱乐早知道
2026年2月11日