本研究提出了AnytimeReasoner框架,旨在提高大型语言模型的推理效率。通过优化令牌预算,显著提升了训练和令牌效率,实验证明其在数学推理任务中优于现有技术。
本研究提出了一种动态估计令牌预算的推理框架,旨在提高大语言模型的令牌使用效率,降低成本,并在仅轻微影响性能的情况下实现效率与准确性的平衡。
完成下面两步后,将自动完成登录并继续当前操作。