增强形式定理证明:一个用于训练 Coq 代码 AI 模型的综合数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了LeanDojo,一个开源的证明环境,提供有价值的前提数据,以便于选取前提。使用此数据,开发了ReProver,第一个增加检索功能的证明程序。实验结果表明,ReProver非常有效。

🎯

关键要点

  • LeanDojo 是一个开源、可交互的证明环境。
  • LeanDojo 从 Lean 中提取证明数据及注释,提供有价值的前提数据。
  • 使用 LeanDojo 提供的数据,开发了 ReProver,这是第一个增加检索功能的基于 LLM 的证明程序。
  • ReProver 的训练成本低廉,仅需一台 GPU 进行一周的训练。
  • ReProver 能有效选择定理中的前提。
  • 构建了一个包含 96962 个定理和证明的新基准,用于培训和评估。
  • 实验结果表明,ReProver 相对于非检索基线和 GPT-4 非常有效。
  • 发布了代码和数据集,以促进进一步的研究。
➡️

继续阅读