ImProver:基于智能体的自动化证明优化
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
LeanDojo是一个开源的交互式证明环境,提取Lean中的数据和注释来帮助选择前提。基于这些数据,我们开发了ReProver,这是首个带有检索功能的LLM证明程序,只需一台GPU训练一周。我们创建了一个包含96962个定理的新基准进行评估。实验表明,ReProver比非检索基线和GPT-4更有效。代码和数据集已发布以支持进一步研究。
🎯
关键要点
- LeanDojo是一个开源的交互式证明环境,提取Lean中的数据和注释以帮助选择前提。
- 基于LeanDojo的数据,开发了ReProver,这是首个带有检索功能的LLM证明程序。
- ReProver的训练成本低,仅需一台GPU训练一周。
- 创建了一个包含96962个定理的新基准用于评估ReProver的性能。
- 实验结果显示,ReProver比非检索基线和GPT-4更有效。
- 代码和数据集已发布,以支持进一步研究。
➡️