机器之心 ·

超越DeepSeek-ProverV1.5！豆包首个形式化数学推理模型BFS-Prover来了，直接开源

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

AIxiv专栏促进学术交流，报道超过2000篇内容。自动形式化数学定理证明是AI在数学推理中的重要应用。BFS-Prover系统通过专家迭代和优化策略，在MiniF2F测试集上实现72.95%的准确率，超越传统复杂算法，展示了简洁算法的潜力。

🎯

🔎

BFS-Prover引入了专家迭代、自适应性数据过滤和直接偏好优化等关键技术。这些创新不仅提升了模型的准确性，还降低了计算复杂度，使得在处理复杂数学问题时更加高效。尤其是专家迭代机制，通过不断优化训练数据，确保模型能够逐步掌握更具挑战性的定理证明策略。

BFS-Prover的成功展示了简单算法在自动定理证明中的潜力，超越了依赖复杂搜索算法的传统方法，如蒙特卡洛树搜索和价值函数。这一突破表明，简洁的算法设计结合合理的优化策略，能够在准确性和效率上取得显著提升，值得其他领域借鉴。

尽管BFS-Prover在MiniF2F测试集上取得了优异成绩，但自动定理证明仍面临庞大搜索空间和动态变化策略等挑战。未来，团队计划进一步提升BFS方法在更复杂数学问题上的能力，推动自动定理证明领域的发展，为数学研究提供更强大的支持。

❓

BFS-Prover是一种新型的自动定理证明系统，采用简单的最优先树搜索算法，旨在提高数学推理的效率和准确性。

BFS-Prover在MiniF2F测试集上实现了72.95%的准确率，创造了新的领域记录。

BFS-Prover通过简化算法和优化策略，超越了传统复杂算法，如蒙特卡洛树搜索，展示了更高的效率和准确性。

BFS-Prover引入了专家迭代、自适应性数据过滤和直接偏好优化等关键技术。

BFS-Prover通过专家迭代和数据过滤机制，逐步提升模型能力，成功证明多个复杂的IMO题目。

BFS-Prover的论文成果已对外公开，模型也已开源，欢迎相关研究者进行交流。

🏷️