本研究提出了一种难度适应性慢思考(DAST)框架,旨在解决现有推理模型在简单问题上过度推理的问题。通过引入令牌长度预算(TLB)量化问题难度,DAST能够动态调整推理链的长度,减少简单任务中的冗余步骤,同时在复杂任务中保持准确性。
完成下面两步后,将自动完成登录并继续当前操作。