Claude悄悄降智67%:从thinking机制到工程性能退化的数据证据拆解

Claude悄悄降智67%:从thinking机制到工程性能退化的数据证据拆解

💡 原文中文,约7700字,阅读约需19分钟。
📝

内容提要

自2026年2月起,Claude模型的推理深度下降67%,导致其在复杂工程任务中的表现显著退化,用户需频繁干预,效率降低。推理能力不足成为主要瓶颈,需恢复推理深度以提升工程能力。

🎯

关键要点

  • 自2026年2月起,Claude模型的推理深度下降67%。

  • 推理能力不足导致模型在复杂工程任务中的表现显著退化。

  • 用户需频繁干预,效率降低,推理过程被隐藏与能力变化的时间线重合。

  • 推理深度下降的量化证据显示,推理长度从2200字符降至600字符。

  • 模型行为从深思熟虑转向条件反射,导致错误率飙升。

  • Read:Edit比例显著下降,模型在修改代码前读取相关文件的次数减少。

  • 整文件重写比例翻倍,模型倾向于整体重写而非局部修改。

  • 用户反馈显示中断次数增加,纠错需求暴涨,任务完成率下降。

  • 推理深度下降导致模型失去规划能力和自检能力。

  • 官方解释与用户数据之间存在关键冲突,用户普遍不接受官方解释。

  • adaptive thinking机制在复杂任务中失效,导致推理预算不足。

  • 用户交互方式转变为逐步控制模型行为,降低了效率。

  • 当前问题的核心是推理预算成为瓶颈,而非模型知识不足。

  • 建议主动提高推理强度设置,以恢复工程能力。

延伸问答

Claude模型推理深度下降的具体幅度是多少?

自2026年2月起,Claude模型的推理深度下降了67%。

推理深度下降对模型表现有什么影响?

推理深度下降导致模型在复杂工程任务中的表现显著退化,用户需频繁干预,效率降低。

用户反馈中提到的中断次数增加了多少倍?

用户反馈显示中断次数增加了十二倍。

推理深度下降的原因是什么?

推理深度下降的核心原因是推理预算成为瓶颈,而非模型知识不足。

如何恢复Claude模型的工程能力?

建议主动提高推理强度设置,以恢复工程能力。

用户与模型的交互方式发生了怎样的变化?

用户交互方式转变为逐步控制模型行为,降低了效率。

➡️

继续阅读