💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。新版本在指令执行和代码重构方面更可靠,得分显著提高。同时,Claude Code也更新,增加了VS Code扩展和实时修改功能。新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。
🎯
关键要点
- Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。
- Sonnet 4.5在指令执行和代码重构方面更可靠,得分显著提高。
- Sonnet 4.5在SWE-Bench Verified基准测试中得分77.2%,在OSWorld基准测试中成功率达到61.4%。
- Sonnet 4.5能够自主运行长达30小时,显著提升了复杂任务的处理能力。
- Claude Code更新,增加了VS Code扩展和实时修改功能,使用量增长超过10倍。
- 推出Claude Agent SDK,允许开发者基于Claude Code构建自己的代理。
- 新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。
- Sonnet 4.5是首个能够重建Claude.ai网页应用的模型,耗时约五个半小时。
- Sonnet 4.5的定价保持不变,为每百万个输入/输出令牌3美元/15美元。
❓
延伸问答
Claude Sonnet 4.5有什么主要改进?
Claude Sonnet 4.5在指令执行和代码重构方面更可靠,得分显著提高,能够自主运行长达30小时。
Claude Sonnet 4.5的定价是多少?
Sonnet 4.5的定价为每百万个输入/输出令牌3美元/15美元,保持不变。
Claude Code的新功能有哪些?
Claude Code增加了VS Code扩展、实时修改功能和改进的状态可见性,使用量增长超过10倍。
什么是“Imagine with Claude”实验?
“Imagine with Claude”是一个实验,展示Claude Sonnet 4.5实时生成软件的能力,目前仅限Claude Max用户使用。
Claude Sonnet 4.5在基准测试中的表现如何?
在SWE-Bench Verified基准测试中,Sonnet 4.5得分77.2%,在OSWorld基准测试中成功率达到61.4%。
Claude Agent SDK的功能是什么?
Claude Agent SDK允许开发者基于Claude Code构建自己的代理,提供代理编排、内存和上下文管理等功能。
➡️