The New Stack ·

Anthropic推出Claude Sonnet 4.5

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

Anthropic推出Claude Sonnet 4.5，称其为“世界最佳编码模型”。新版本在指令执行和代码重构方面更可靠，得分显著提高。同时，Claude Code也更新，增加了VS Code扩展和实时修改功能。新实验“Imagine with Claude”展示了实时生成软件的能力，目前仅限Claude Max用户使用。

🎯

关键要点

Anthropic推出Claude Sonnet 4.5，称其为“世界最佳编码模型”。
Sonnet 4.5在指令执行和代码重构方面更可靠，得分显著提高。
Sonnet 4.5在SWE-Bench Verified基准测试中得分77.2%，在OSWorld基准测试中成功率达到61.4%。
Sonnet 4.5能够自主运行长达30小时，显著提升了复杂任务的处理能力。
Claude Code更新，增加了VS Code扩展和实时修改功能，使用量增长超过10倍。
推出Claude Agent SDK，允许开发者基于Claude Code构建自己的代理。
新实验“Imagine with Claude”展示了实时生成软件的能力，目前仅限Claude Max用户使用。
Sonnet 4.5是首个能够重建Claude.ai网页应用的模型，耗时约五个半小时。
Sonnet 4.5的定价保持不变，为每百万个输入/输出令牌3美元/15美元。

🔎

延伸解读

Claude Sonnet 4.5的性能提升

Claude Sonnet 4.5在指令执行和代码重构方面的可靠性显著提高，尤其在SWE-Bench和OSWorld基准测试中表现出色。这意味着开发者在使用该模型时，可以期待更高的成功率和更少的错误，尤其是在处理复杂任务时。

Claude Code的新功能

Claude Code的更新包括VS Code扩展和实时修改功能，极大提升了开发者的工作效率。实时查看代码变更和改进的状态可帮助开发者更好地管理项目，减少了手动回滚代码的麻烦，提升了整体开发体验。

Imagine with Claude实验的潜力

“Imagine with Claude”实验展示了实时生成软件的能力，虽然目前仅限于Claude Max用户，但它预示着未来AI在软件开发中的应用潜力。此类技术可能会改变开发流程，使得软件开发更加灵活和高效。

❓

延伸问答

Claude Sonnet 4.5有什么主要改进？

Claude Sonnet 4.5在指令执行和代码重构方面更可靠，得分显著提高，能够自主运行长达30小时。

Claude Sonnet 4.5的定价是多少？

Sonnet 4.5的定价为每百万个输入/输出令牌3美元/15美元，保持不变。

Claude Code的新功能有哪些？

Claude Code增加了VS Code扩展、实时修改功能和改进的状态可见性，使用量增长超过10倍。

什么是“Imagine with Claude”实验？

“Imagine with Claude”是一个实验，展示Claude Sonnet 4.5实时生成软件的能力，目前仅限Claude Max用户使用。

Claude Sonnet 4.5在基准测试中的表现如何？

在SWE-Bench Verified基准测试中，Sonnet 4.5得分77.2%，在OSWorld基准测试中成功率达到61.4%。

Claude Agent SDK的功能是什么？

Claude Agent SDK允许开发者基于Claude Code构建自己的代理，提供代理编排、内存和上下文管理等功能。

🏷️