Claude Opus 4.7 发布:更费token了,用户评价两极

Claude Opus 4.7 发布:更费token了,用户评价两极

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

Anthropic发布了新模型Claude Opus 4.7,增强了编程和多模态能力,但用户反馈两极。新模型在处理复杂任务时更严谨,支持高分辨率图像输入。然而,token消耗显著增加,部分功能下降,尤其在文案撰写和长上下文检索方面。用户在法律和金融领域需谨慎使用。

🎯

关键要点

  • Anthropic发布了新模型Claude Opus 4.7,增强了编程和多模态能力。
  • 新模型在处理复杂任务时更加严谨,支持高分辨率图像输入,长边最大可达2,576像素。
  • token消耗显著增加,相同内容的token数变为原来的1.0到1.35倍,导致实际成本上涨10%-35%。
  • 用户反馈两极,大部分用户认可编程能力的提升,但在文案撰写和长上下文检索方面表现不佳。
  • 在长上下文检索上,Opus 4.7的评分从Opus 4.6的78.3%降至32.2%。
  • 法律和金融领域的用户需谨慎使用Opus 4.7,因其在处理长文档时表现不佳。
  • Opus 4.7的联网搜索和Agent能力有所下降,Agentic search评分从Opus 4.6的83.7%降至79.3%。
  • 用户对Opus 4.7的文笔变化表示不满,认为其输出内容质量下降,且推理过程不再默认输出。

延伸问答

Claude Opus 4.7相比于4.6有哪些主要改进?

Claude Opus 4.7在编程和多模态能力上有显著提升,支持高分辨率图像输入,并在处理复杂任务时更加严谨。

Opus 4.7的token消耗情况如何?

Opus 4.7的token消耗显著增加,相同内容的token数变为原来的1.0到1.35倍,导致实际成本上涨10%-35%。

用户对Opus 4.7的反馈如何?

用户反馈两极,大部分认可其编程能力提升,但在文案撰写和长上下文检索方面表现不佳。

在法律和金融领域使用Opus 4.7需要注意什么?

法律和金融领域的用户需谨慎使用Opus 4.7,因为其在处理长文档时表现不佳。

Opus 4.7在长上下文检索方面的表现如何?

Opus 4.7在长上下文检索上的评分从Opus 4.6的78.3%降至32.2%。

Opus 4.7的安全性如何?

Opus 4.7的安全性与Opus 4.6相似,具备自动检测和拦截功能,但在某些方面略有不足。

➡️

继续阅读