研究论文《DeepDistill》提出了一种新方法,通过构建大型分级推理数据集,显著提升大语言模型(LLM)的推理能力。研究发现,推理训练需要更高的学习率,最终在AIME2024基准测试中实现79.2%的通过率,接近最先进水平。
完成下面两步后,将自动完成登录并继续当前操作。