小红花·文摘

本研究提出了一种新方法，通过自适应问题难度生成高质量链式思维（CoT）数据，以解决大型语言模型在复杂任务中的推理能力不均衡问题。该方法显著降低了数据生成成本，提高了模型微调效率，并在数学竞赛和代码生成领域验证了其有效性。