MuMath-Code:结合多角度数据增强的数学推理工具使用大型语言模型
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一种结合外部工具和数据增强的方法,并采用两阶段的训练策略,以实现数学推理能力的增强。经过大量实验证明,我们的方法在数学推理任务上取得了新的最佳性能。
该文章介绍了一种通过微调开源语言模型来增强数学推理能力的方法。作者提出了一个名为MathCodeInstruct的新颖数据集,用于生成包含数学问题和基于代码的解决方案。通过定制的有监督微调和推理方法,生成了MathCoder模型,该模型在数学问题数据集上取得了较高的得分。该模型超过了其他开源方案,并在竞争级别的数学数据集上超过了GPT-4模型。