机器之心 ·

首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

AI数学奥林匹克比赛冠军团队使用了NuminaMath 7B TIR模型，该模型是deepseek-math-7b-base的微调版本。第二名和第三名团队也使用了DeepSeek-Math-7B-RL模型，但微调了不同的参数。前四名团队都选择了DeepSeekMath-7B作为基础模型。NuminaMath 7B TIR模型在数学问题推理方面表现出色，但在几何问题上存在一定困难。

🎯

关键要点

AI数学奥林匹克比赛中，Numina团队获得冠军，CMU_MATH第二，after exams第三，codeinter和Conor #2分别第四和第五。
冠军团队使用的模型是NuminaMath 7B TIR，是deepseek-math-7b-base的微调版本。
第二名和第三名团队使用了DeepSeek-Math-7B-RL模型，但微调了不同的参数。
前四名团队均选择DeepSeekMath-7B作为基础模型，表现优异。
NuminaMath 7B TIR模型在数学问题推理方面表现出色，但在几何问题上存在困难。
NuminaMath 7B TIR模型经过两个阶段的监督微调，第一阶段在自然语言数学问题上微调，第二阶段在工具集成推理的合成数据集上微调。
该模型专为解决竞赛级别数学问题而创建，不适用于一般聊天应用程序。
冠军团队发现该模型能够解决AMC 12级别的问题，但对AIME和数学奥林匹克级困难问题的解决方案生成较难。

❓

延伸问答

AI数学奥林匹克比赛的冠军团队使用了什么模型？

冠军团队使用的模型是NuminaMath 7B TIR。

NuminaMath 7B TIR模型的特点是什么？

NuminaMath 7B TIR模型是deepseek-math-7b-base的微调版本，专为解决竞赛级别数学问题而创建。

第二名和第三名团队使用了什么模型？

第二名和第三名团队使用了DeepSeek-Math-7B-RL模型，但微调了不同的参数。

NuminaMath 7B TIR模型在数学问题推理方面表现如何？

该模型在数学问题推理方面表现出色，但在几何问题上存在一定困难。

NuminaMath 7B TIR模型的微调过程是怎样的？

该模型经过两个阶段的监督微调，第一阶段在自然语言数学问题上微调，第二阶段在工具集成推理的合成数据集上微调。

为什么NuminaMath 7B TIR模型不适用于一般聊天应用程序？

该模型专为解决竞赛级别数学问题而创建，不适用于一般聊天应用程序。

🏷️