本研究提出了自适应难度课程学习和专家指导自我改写两种策略,以提升大型语言模型在复杂问题上的推理能力。实验结果显示,这些策略显著改善了模型在数学推理基准上的表现。
完成下面两步后,将自动完成登录并继续当前操作。