$微软研究院推出rStar-Math：推动小型语言模型的数学推理能力$

InfoQ ·

微软研究院推出rStar-Math：推动小型语言模型的数学推理能力

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

微软研究院推出rStar-Math框架，展示小型语言模型在数学推理中的优越能力，甚至超过大型模型。该框架采用蒙特卡洛树搜索（MCTS）方法，通过自我进化提升模型和训练数据质量。在多个数学基准测试中，rStar-Math表现出色，准确率显著提高，并作为开源项目供研究人员使用。

🎯

🔎

rStar-Math展示了小型语言模型在数学推理中的潜力，甚至超越了大型模型。这一发现可能会改变AI模型的开发方向，尤其是在资源有限的情况下，开发者可以考虑使用小型模型来实现高效的数学推理。

rStar-Math通过自我进化和蒙特卡洛树搜索（MCTS）提升模型质量，解决了高质量数据集稀缺的问题。这种方法不仅提高了模型的推理能力，也为未来的AI研究提供了新的思路，尤其是在数据生成和模型训练方面。

作为开源项目，rStar-Math允许研究人员和工程师自由探索和利用其框架。这种开放性促进了学术界和工业界的合作，可能加速数学推理AI的发展，推动更多创新应用的出现。

❓

rStar-Math框架展示了小型语言模型在数学推理中的能力，甚至超过大型模型。

rStar-Math采用蒙特卡洛树搜索（MCTS）方法，通过自我进化来提升模型和训练数据的质量。

rStar-Math在多个数学基准测试中表现出色，Qwen2.5-Math-7B模型的准确率从58.8%提高到90.0%。

rStar-Math引入代码增强的CoT数据合成方法，通过MCTS生成验证的推理轨迹，确保高质量训练数据。

rStar-Math作为开源项目在GitHub上发布，允许研究人员和工程师探索和利用该框架。

在美国数学奥林匹克（AIME）中，rStar-Math取得53.3%的成功率，平均解决15道题中的8道。

🏷️