本研究提出了一种新方法,通过自适应问题难度生成高质量链式思维(CoT)数据,以解决大型语言模型在复杂任务中的推理能力不均衡问题。该方法显著降低了数据生成成本,提高了模型微调效率,并在数学竞赛和代码生成领域验证了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。