思维操控:外部思维对大型推理模型的高效性
📝
内容提要
本研究针对大型推理模型(LRMs)在生成冗余推理步骤时所面临的“过度思考”问题,提出了一种新方法。通过实证分析,我们发现将小型模型生成的外部思维链(CoTs)放置在思考标记之间,可以有效减少思考步骤。最终,我们的ThoughtMani方法提高了模型的效率,减少了约30%的输出令牌,并在安全对齐方面提升了10%。
🏷️
标签
➡️