小红花·文摘

本研究提出了自适应难度课程学习和专家指导自我改写两种策略，以提升大型语言模型在复杂问题上的推理能力。实验结果显示，这些策略显著改善了模型在数学推理基准上的表现。