内容提要
Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。新版本在指令执行和代码重构方面更可靠,得分显著提高。同时,Claude Code也更新,增加了VS Code扩展和实时修改功能。新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。
关键要点
-
Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。
-
Sonnet 4.5在指令执行和代码重构方面更可靠,得分显著提高。
-
Sonnet 4.5在SWE-Bench Verified基准测试中得分77.2%,在OSWorld基准测试中成功率达到61.4%。
-
Sonnet 4.5能够自主运行长达30小时,显著提升了复杂任务的处理能力。
-
Claude Code更新,增加了VS Code扩展和实时修改功能,使用量增长超过10倍。
-
推出Claude Agent SDK,允许开发者基于Claude Code构建自己的代理。
-
新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。
-
Sonnet 4.5是首个能够重建Claude.ai网页应用的模型,耗时约五个半小时。
-
Sonnet 4.5的定价保持不变,为每百万个输入/输出令牌3美元/15美元。
延伸解读
Claude Sonnet 4.5的性能提升
Claude Sonnet 4.5在指令执行和代码重构方面的可靠性显著提高,尤其在SWE-Bench和OSWorld基准测试中表现出色。这意味着开发者在使用该模型时,可以期待更高的成功率和更少的错误,尤其是在处理复杂任务时。
Claude Code的新功能
Claude Code的更新包括VS Code扩展和实时修改功能,极大提升了开发者的工作效率。实时查看代码变更和改进的状态可帮助开发者更好地管理项目,减少了手动回滚代码的麻烦,提升了整体开发体验。
Imagine with Claude实验的潜力
“Imagine with Claude”实验展示了实时生成软件的能力,虽然目前仅限于Claude Max用户,但它预示着未来AI在软件开发中的应用潜力。此类技术可能会改变开发流程,使得软件开发更加灵活和高效。
延伸问答
Claude Sonnet 4.5有什么主要改进?
Claude Sonnet 4.5在指令执行和代码重构方面更可靠,得分显著提高,能够自主运行长达30小时。
Claude Sonnet 4.5的定价是多少?
Sonnet 4.5的定价为每百万个输入/输出令牌3美元/15美元,保持不变。
Claude Code的新功能有哪些?
Claude Code增加了VS Code扩展、实时修改功能和改进的状态可见性,使用量增长超过10倍。
什么是“Imagine with Claude”实验?
“Imagine with Claude”是一个实验,展示Claude Sonnet 4.5实时生成软件的能力,目前仅限Claude Max用户使用。
Claude Sonnet 4.5在基准测试中的表现如何?
在SWE-Bench Verified基准测试中,Sonnet 4.5得分77.2%,在OSWorld基准测试中成功率达到61.4%。
Claude Agent SDK的功能是什么?
Claude Agent SDK允许开发者基于Claude Code构建自己的代理,提供代理编排、内存和上下文管理等功能。