小红花·文摘

本文提出Kwai-STaR框架，旨在提升大型语言模型（LLMs）在数学推理中的能力。通过定义状态空间和生成状态转移数据，结合课程训练策略，显著提高了LLMs的推理效率和表现。