本研究提出自我调节微调(SBT)框架,旨在解决大型推理模型的过度思考问题。该方法通过内部调节推理过程,减少冗余推理,降低计算开销,令牌消耗减少高达60%,同时保持准确性。
完成下面两步后,将自动完成登录并继续当前操作。