💡
原文中文,约2900字,阅读约需7分钟。
📝
内容提要
Anthropic发布了新模型Claude Opus 4.7,增强了编程和多模态能力,但用户反馈两极。新模型在处理复杂任务时更严谨,支持高分辨率图像输入。然而,token消耗显著增加,部分功能下降,尤其在文案撰写和长上下文检索方面。用户在法律和金融领域需谨慎使用。
🎯
关键要点
- Anthropic发布了新模型Claude Opus 4.7,增强了编程和多模态能力。
- 新模型在处理复杂任务时更加严谨,支持高分辨率图像输入,长边最大可达2,576像素。
- token消耗显著增加,相同内容的token数变为原来的1.0到1.35倍,导致实际成本上涨10%-35%。
- 用户反馈两极,大部分用户认可编程能力的提升,但在文案撰写和长上下文检索方面表现不佳。
- 在长上下文检索上,Opus 4.7的评分从Opus 4.6的78.3%降至32.2%。
- 法律和金融领域的用户需谨慎使用Opus 4.7,因其在处理长文档时表现不佳。
- Opus 4.7的联网搜索和Agent能力有所下降,Agentic search评分从Opus 4.6的83.7%降至79.3%。
- 用户对Opus 4.7的文笔变化表示不满,认为其输出内容质量下降,且推理过程不再默认输出。
❓
延伸问答
Claude Opus 4.7相比于4.6有哪些主要改进?
Claude Opus 4.7在编程和多模态能力上有显著提升,支持高分辨率图像输入,并在处理复杂任务时更加严谨。
Opus 4.7的token消耗情况如何?
Opus 4.7的token消耗显著增加,相同内容的token数变为原来的1.0到1.35倍,导致实际成本上涨10%-35%。
用户对Opus 4.7的反馈如何?
用户反馈两极,大部分认可其编程能力提升,但在文案撰写和长上下文检索方面表现不佳。
在法律和金融领域使用Opus 4.7需要注意什么?
法律和金融领域的用户需谨慎使用Opus 4.7,因为其在处理长文档时表现不佳。
Opus 4.7在长上下文检索方面的表现如何?
Opus 4.7在长上下文检索上的评分从Opus 4.6的78.3%降至32.2%。
Opus 4.7的安全性如何?
Opus 4.7的安全性与Opus 4.6相似,具备自动检测和拦截功能,但在某些方面略有不足。
➡️