小红花·文摘 - 小红花技术领袖俱乐部

AI Agent搞定世纪首次菲尔兹奖成果形式化！一周时间独立完成，20万行代码已公开

AI Agent搞定世纪首次菲尔兹奖成果形式化！一周时间独立完成，20万行代码已公开

量子位 ·

文章讨论了AI在数学推理和形式化证明方面的最新进展，特别是大模型的能力。5月29日将举行直播，邀请多个项目团队成员探讨AI数学的未来及其影响。

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播

量子位 ·

DeepSeek推出的Prover-V2模型专注于数学定理证明，刷新多项基准测试记录。该7B模型成功解决了671B模型未能解决的问题，展现出独特的推理模式。Prover-V2结合强化学习与子目标分解，提升了形式化与非形式化证明的能力，标志着数学领域的重要进展。

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

量子位 ·

数学家陶哲轩在使用Lean4时发现一篇已发表论文中的错误，计划将语言模型与证明助手连接起来。Lean4主要用于写数学证明，也可用于编程。形式验证可减少软件开发中的错误。

数学家陶哲轩在形式证明帮助下发现论文中错误

极道 ·