DeepSeek-Prover: 通过大规模合成数据推进 LLMs 中的定理证明

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了LeanDojo,一个开源的证明环境,提供有价值的前提数据,以便于选取前提。使用此数据,开发了ReProver,第一个增加检索功能的证明程序。实验结果表明,ReProver非常有效。

🎯

关键要点

  • LeanDojo 是一个开源、可交互的证明环境。

  • LeanDojo 从 Lean 中提取证明数据及注释,提供有价值的前提数据。

  • 使用 LeanDojo 提供的数据,开发了 ReProver,这是第一个增加检索功能的基于 LLM 的证明程序。

  • ReProver 的训练成本低廉,仅需一台 GPU 进行一周的训练。

  • ReProver 能有效选择定理中的前提。

  • 构建了一个包含 96962 个定理和证明的新基准,用于培训和评估。

  • 实验结果表明,ReProver 相对于非检索基线和 GPT-4 非常有效。

  • 发布了代码和数据集,以促进进一步的研究。

➡️

继续阅读