AI Agent Gauss在一周内独立完成了菲尔兹奖成果的形式化证明,生成20万行代码,成为历史上最大规模的Lean形式化项目。该成果验证了8维和24维最优球体堆积问题,并修正了原论文中的错误,标志着自动形式化领域的重要突破。
文章讨论了AI在数学推理和形式化证明方面的最新进展,特别是大模型的能力。5月29日将举行直播,邀请多个项目团队成员探讨AI数学的未来及其影响。
DeepSeek推出的Prover-V2模型专注于数学定理证明,刷新多项基准测试记录。该7B模型成功解决了671B模型未能解决的问题,展现出独特的推理模式。Prover-V2结合强化学习与子目标分解,提升了形式化与非形式化证明的能力,标志着数学领域的重要进展。
数学家陶哲轩在使用Lean4时发现一篇已发表论文中的错误,计划将语言模型与证明助手连接起来。Lean4主要用于写数学证明,也可用于编程。形式验证可减少软件开发中的错误。
完成下面两步后,将自动完成登录并继续当前操作。