腾讯AI Lab与苏州大学、上海交通大学的研究发现长推理模型存在“思考不足”现象,表现为推理过程中频繁切换思路,导致准确性下降。研究提出了思考不足指标,并引入思路切换惩罚策略,以提升模型在复杂问题上的表现。
新研究表明,DeepSeek等推理大模型在处理复杂问题时,因频繁切换思路导致思维不足,影响答案的准确性。研究团队提出了“思路切换惩罚机制”,有效提升了模型的准确率并减少了无效思考。
完成下面两步后,将自动完成登录并继续当前操作。