小红花·文摘

本研究提出了一种难度适应性慢思考（DAST）框架，旨在解决现有推理模型在简单问题上过度推理的问题。通过引入令牌长度预算(TLB)量化问题难度，DAST能够动态调整推理链的长度，减少简单任务中的冗余步骤，同时在复杂任务中保持准确性。