Hilbert是一个结合非正式推理与正式验证的框架,旨在提升形式证明的生成能力。它通过递归分解问题,将复杂任务拆分为子目标,并利用专门的证明LLM和验证器进行求解。实验结果表明,Hilbert在多个基准测试中表现优异,解决了70%的问题,显著超越现有方法,缩小了非正式推理与正式证明之间的差距。
本研究提出了MA-LoT框架,解决了单一大型语言模型在形式证明中的不足。该框架是首个多智能体Lean4形式定理证明系统,通过结构化互动和长链思维,MiniF2F-Test数据集的准确率达到54.51%,显著优于现有方法,展示了更深的推理能力。
本研究提出了一种神经符号策略生成器,结合大型语言模型与符号推理,解决了大型语言模型在形式证明中的策略生成不足问题。通过分析人类解决奥林匹克不等式的方式,提出了两类策略并在数学竞赛中进行评估,取得了显著的性能提升。
本研究提出了开源大型语言模型戈德尔证明者,解决了自动形式证明中正式数学语句和证明稀缺的问题,生成了166万条正式语句和29,700条形式证明,成功率为57.6%。
本研究结合ChatGPT与基本搜索技术,提升了形式证明生成的效率和可及性,最佳模型的通过率达到31.15%,为AI辅助的形式证明生成提供了新见解。
我设计了一个开放式逻辑难题,挑战自动推理,要求找到比现有数千步的最短证明更短的形式证明。欢迎有兴趣的开发者参与。
本文介绍了一种利用Isabelle证明助手测试自动推理课程学习成果的方法,强调对高阶逻辑中形式证明的理解。讨论了考试和评分经验,以及未来的研究方向,提及了一些基于高阶逻辑的定理证明器和机器学习应用的进展。
本文探讨了“鬼”符号的意义,认为它是一个没有内容的形式符号,每个人都可以向其中加入自己的内容和理解。上海万圣节的特点是cosplay,将各种奇装异服带上了街头。数学是一种形式逻辑,没有数学语言就没有科学思想。形式证明可以帮助发现错误。
完成下面两步后,将自动完成登录并继续当前操作。