DeepSeekMath:推动开放语言模型中数学推理的极限
该研究介绍了一种通过微调开源语言模型来增强数学推理能力的方法。作者提出了MathCodeInstruct数据集,用于生成数学问题和基于代码的解决方案。通过定制的有监督微调和推理方法,开发了MathCoder模型,该模型在数学问题数据集上表现出色。研究结果将于2023年10月发布。
原文中文,约400字,阅读约需1分钟。
该研究介绍了一种通过微调开源语言模型来增强数学推理能力的方法。作者提出了MathCodeInstruct数据集,用于生成数学问题和基于代码的解决方案。通过定制的有监督微调和推理方法,开发了MathCoder模型,该模型在数学问题数据集上表现出色。研究结果将于2023年10月发布。