DeepSeek-Prover: 通过大规模合成数据推进 LLMs 中的定理证明
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了LeanDojo,一个开源的证明环境,提供有价值的前提数据,以便于选取前提。使用此数据,开发了ReProver,第一个增加检索功能的证明程序。实验结果表明,ReProver非常有效。
🎯
关键要点
-
LeanDojo 是一个开源、可交互的证明环境。
-
LeanDojo 从 Lean 中提取证明数据及注释,提供有价值的前提数据。
-
使用 LeanDojo 提供的数据,开发了 ReProver,这是第一个增加检索功能的基于 LLM 的证明程序。
-
ReProver 的训练成本低廉,仅需一台 GPU 进行一周的训练。
-
ReProver 能有效选择定理中的前提。
-
构建了一个包含 96962 个定理和证明的新基准,用于培训和评估。
-
实验结果表明,ReProver 相对于非检索基线和 GPT-4 非常有效。
-
发布了代码和数据集,以促进进一步的研究。
➡️