Anthropic推出Claude Sonnet 4.5

Anthropic推出Claude Sonnet 4.5

💡 原文英文,约1000词,阅读约需4分钟。
📝

内容提要

Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。新版本在指令执行和代码重构方面更可靠,得分显著提高。同时,Claude Code也更新,增加了VS Code扩展和实时修改功能。新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。

🎯

关键要点

  • Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。

  • Sonnet 4.5在指令执行和代码重构方面更可靠,得分显著提高。

  • Sonnet 4.5在SWE-Bench Verified基准测试中得分77.2%,在OSWorld基准测试中成功率达到61.4%。

  • Sonnet 4.5能够自主运行长达30小时,显著提升了复杂任务的处理能力。

  • Claude Code更新,增加了VS Code扩展和实时修改功能,使用量增长超过10倍。

  • 推出Claude Agent SDK,允许开发者基于Claude Code构建自己的代理。

  • 新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。

  • Sonnet 4.5是首个能够重建Claude.ai网页应用的模型,耗时约五个半小时。

  • Sonnet 4.5的定价保持不变,为每百万个输入/输出令牌3美元/15美元。

🔎

延伸解读

Claude Sonnet 4.5的性能提升

Claude Sonnet 4.5在指令执行和代码重构方面的可靠性显著提高,尤其在SWE-Bench和OSWorld基准测试中表现出色。这意味着开发者在使用该模型时,可以期待更高的成功率和更少的错误,尤其是在处理复杂任务时。

Claude Code的新功能

Claude Code的更新包括VS Code扩展和实时修改功能,极大提升了开发者的工作效率。实时查看代码变更和改进的状态可帮助开发者更好地管理项目,减少了手动回滚代码的麻烦,提升了整体开发体验。

Imagine with Claude实验的潜力

“Imagine with Claude”实验展示了实时生成软件的能力,虽然目前仅限于Claude Max用户,但它预示着未来AI在软件开发中的应用潜力。此类技术可能会改变开发流程,使得软件开发更加灵活和高效。

延伸问答

Claude Sonnet 4.5有什么主要改进?

Claude Sonnet 4.5在指令执行和代码重构方面更可靠,得分显著提高,能够自主运行长达30小时。

Claude Sonnet 4.5的定价是多少?

Sonnet 4.5的定价为每百万个输入/输出令牌3美元/15美元,保持不变。

Claude Code的新功能有哪些?

Claude Code增加了VS Code扩展、实时修改功能和改进的状态可见性,使用量增长超过10倍。

什么是“Imagine with Claude”实验?

“Imagine with Claude”是一个实验,展示Claude Sonnet 4.5实时生成软件的能力,目前仅限Claude Max用户使用。

Claude Sonnet 4.5在基准测试中的表现如何?

在SWE-Bench Verified基准测试中,Sonnet 4.5得分77.2%,在OSWorld基准测试中成功率达到61.4%。

Claude Agent SDK的功能是什么?

Claude Agent SDK允许开发者基于Claude Code构建自己的代理,提供代理编排、内存和上下文管理等功能。

🏷️

标签

➡️

继续阅读