本文提出Kwai-STaR框架,旨在提升大型语言模型(LLMs)在数学推理中的能力。通过定义状态空间和生成状态转移数据,结合课程训练策略,显著提高了LLMs的推理效率和表现。
完成下面两步后,将自动完成登录并继续当前操作。