小红花·文摘

本研究提出自我调节微调（SBT）框架，旨在解决大型推理模型的过度思考问题。该方法通过内部调节推理过程，减少冗余推理，降低计算开销，令牌消耗减少高达60%，同时保持准确性。