腾讯AI Lab与苏州大学、上海交通大学的研究发现长推理模型存在“思考不足”现象,表现为推理过程中频繁切换思路,导致准确性下降。研究提出了思考不足指标,并引入思路切换惩罚策略,以提升模型在复杂问题上的表现。
完成下面两步后,将自动完成登录并继续当前操作。