AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with the OpenMathReasoning Dataset 该研究解决了数学推理模型普遍存在的高质量数据不足和推理能力不足的问题。研究者提出了一种新颖的方法,通过将代码执行与长推理模型结合,并使用生成性解决方案选择策略,显著提升了模型在数学推理基准测试中的表现。研究结果表明,这种集成方法在提升推理质量方面具有潜在的重大影响。 该研究提出了一种新方法,通过结合代码执行与长推理模型,解决了数学推理模型的数据不足和推理能力不足的问题,显著提升了模型性能。 dataset models 代码执行 数学推理 新方法 模型性能 长推理模型