量子位 ·

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

DeepSeek推出的Prover-V2模型专注于数学定理证明，刷新多项基准测试记录。该7B模型成功解决了671B模型未能解决的问题，展现出独特的推理模式。Prover-V2结合强化学习与子目标分解，提升了形式化与非形式化证明的能力，标志着数学领域的重要进展。

🎯

🔎

DeepSeek-Prover-V2模型在数学定理证明领域的创新，尤其是通过子目标分解的强化学习，展示了其在处理复杂问题时的独特优势。这种方法不仅提高了模型的推理能力，还使得小模型能够解决大模型未能解决的问题，标志着数学推理技术的重大进步。

Prover-V2在普特南测试中解决了49道问题，显示出其强大的能力。基准测试不仅是评估模型性能的标准，也是推动研究进展的重要动力。通过与其他模型的比较，Prover-V2的表现为未来的数学证明研究提供了新的方向和灵感。

Prover-V2的发布引发了广泛的社区关注，尤其是在GitHub和社交媒体上的热烈讨论。这表明该模型的创新性和实用性得到了认可，同时也反映出学术界对形式化数学研究的浓厚兴趣。未来，随着R2的发布，可能会带来更多的突破和应用。

❓

DeepSeek-Prover-V2模型专注于数学定理证明，刷新了多项基准测试记录。

Prover-V2成功解决了671B模型未能解决的13个问题，展现出独特的推理模式。

该模型结合了强化学习与子目标分解，提升了形式化与非形式化证明的能力。

Prover-V2采用两阶段训练，第一阶段聚焦快速生成Lean证明代码，第二阶段提升复杂问题推理能力。

ProverBench包含325个问题，其中包括高中竞赛和本科阶段的数学问题。

Prover-V2的作者团队包括多位参与过前作的研究者，且有新成员加入，背景多样。

🏷️