Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

Anthropic 发布的 Claude Haiku 4.5 性能接近 Sonnet 4,但价格仅为其三分之一,速度提升两倍。Haiku 4.5 在编码能力测试中表现优异,适合实时任务,性价比高,值得开发者尝试。尽管数学能力稍显不足。

🎯

关键要点

  • Anthropic 发布了 Claude Haiku 4.5,性能接近 Sonnet 4,价格仅为其三分之一,速度提升两倍。

  • Claude 家族包括 Claude Opus、Sonnet 和 Haiku 三个模型,Haiku 4.5 在编码能力测试中表现优异。

  • Haiku 4.5 在 SWE-bench Verified 测试中取得 73% 的成绩,与 Sonnet 4 和 GPT-5 相当。

  • Haiku 4.5 适合实时、低延迟任务,如聊天助手和客服代理,提供更好的用户体验。

  • Haiku 4.5 的定价为每百万输入 token 1 美元,输出 token 5 美元,相比 Sonnet 4.5 便宜约三倍。

  • Haiku 4.5 在安全性和对齐性测试中表现良好,是 Anthropic 最安全的模型。

  • 尽管 Haiku 4.5 性能优异,但在数学能力上表现不足,存在算术错误。

  • 开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5。

  • Anthropic 计划通过收购引入更多技术人才,扩展 AI 产品的能力,可能涉及金融、医疗和网络安全等领域。

  • Anthropic 在提升模型能力的同时,积极布局生态,最终受益者是开发者和用户。

延伸问答

Claude Haiku 4.5 的主要优势是什么?

Claude Haiku 4.5 性能接近 Sonnet 4,但价格仅为其三分之一,速度提升两倍,适合实时任务。

Haiku 4.5 在编码能力测试中表现如何?

Haiku 4.5 在 SWE-bench Verified 测试中取得 73% 的成绩,与 Sonnet 4 和 GPT-5 相当。

Haiku 4.5 的定价是多少?

Haiku 4.5 的定价为每百万输入 token 1 美元,输出 token 5 美元。

Haiku 4.5 在安全性方面表现如何?

Haiku 4.5 在安全性和对齐性测试中表现良好,是 Anthropic 最安全的模型。

Haiku 4.5 适合哪些应用场景?

Haiku 4.5 适合实时、低延迟任务,如聊天助手和客服代理。

Haiku 4.5 存在什么局限性?

Haiku 4.5 在数学能力上表现不足,存在算术错误。

➡️

继续阅读