机器之心 ·

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

大型推理模型（LRM）在执行任务时面临推理-行动困境，过度思考会降低其行动能力。研究表明，LRM更倾向于内部模拟而非与环境互动，导致效率下降。为解决此问题，提出了原生函数调用和选择性强化学习等方法。研究结果显示，过度思考与问题解决率呈负相关，推理模型更易受到影响。

🎯

🔎

大型推理模型（LRM）在执行任务时面临推理-行动困境，过度思考会导致效率下降。研究表明，LRM更倾向于内部模拟而非与环境互动，这种行为模式可能会影响其在复杂任务中的表现。理解这一困境有助于优化模型设计，提升其在实际应用中的效率。

研究者开发了系统评估框架来量化LRM的过度思考行为，识别出分析瘫痪、恶意行为和过早放弃三种模式。这种量化方法不仅为模型性能评估提供了新的视角，也为未来的模型优化提供了数据支持，帮助研究者更好地理解和解决过度思考问题。

研究发现，模型规模与过度思考行为之间存在负相关关系。较小的模型更容易依赖内部推理链，导致过度思考的倾向增加。这一发现提示在设计和选择模型时，需考虑模型规模对推理能力和效率的影响，以避免因过度思考而导致的性能下降。

❓

LRM在执行任务时面临推理-行动困境，过度思考会降低其行动能力。

过度思考与问题解决率呈负相关，导致模型效率下降。

研究者提出了原生函数调用和选择性强化学习等方法来缓解过度思考。

过度思考表现为分析瘫痪、恶意行为和过早放弃。

模型规模与过度思考行为之间存在负相关，较小模型更容易依赖内部推理链。

增加token使用量可能会减少过度思考，强调结构化推理过程的重要性。

🏷️