AI数学奥林匹克比赛冠军团队使用了NuminaMath 7B TIR模型,该模型是deepseek-math-7b-base的微调版本。第二名和第三名团队也使用了DeepSeek-Math-7B-RL模型,但微调了不同的参数。前四名团队都选择了DeepSeekMath-7B作为基础模型。NuminaMath 7B TIR模型在数学问题推理方面表现出色,但在几何问题上存在一定困难。
该论文研究了大型语言模型在数学问题推理方面的能力,特别关注符号推理在数值问题中的准确性,并通过自提示的方法提高了符号准确性,为模型提供了简洁可验证的推理能力。
完成下面两步后,将自动完成登录并继续当前操作。