AI Agent Gauss在一周内独立完成了菲尔兹奖成果的形式化证明,生成20万行代码,成为历史上最大规模的Lean形式化项目。该成果验证了8维和24维最优球体堆积问题,并修正了原论文中的错误,标志着自动形式化领域的重要突破。
本研究提出了一种迭代自动形式化的方法,解决数学推理中合成数据生成的有效性问题。通过引入定理证明器作为评判者,显著提升了大型语言模型在多个基准测试中的表现,最高准确率提高6.00%。
本研究提出了一种新框架,通过符号等价和语义一致性方法,评估和选择最佳的自动形式化结果,准确性提高了0.22至1.35倍。
完成下面两步后,将自动完成登录并继续当前操作。