Claude Sonnet 4.5来啦,连续30小时编程,依旧领先

[复制链接]
周大 发表于 2025-9-30 14:16:42 | 显示全部楼层 |阅读模式
Anthropic 推出 Claude Sonnet 4.5,宣称其为当前最强编码模型。该模型在 SWE-bench 和 OSWorld 等基准测试中表现领先,任务成功率提升至 61.4%,代码修复准确率达 82%,复杂任务持续运行超 30 小时。安全性方面,其失调行为评分最低,达到 ASL-3 级防护,并显著降低误报率。API 新增记忆与编辑功能,配套推出 Agent SDK 与“Imagine with Claude”实验功能,支持文件创建与多模态交互,价格维持输入 3 美元/百万 token、输出 15 美元不变,成本较 Opus 4.1 降低五倍。
来源:https://mp.weixin.qq.com/s/uBzu14utgOUEugadSpogEA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-9 23:57 , Processed in 0.271286 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表