小红花·文摘

本文提出了一种使用Lean4语言对LLM Agent工作流进行形式化建模与验证的方法，克服了传统经验性测试的不足。主要贡献包括FormalAgentLib库，确保工作流的语义一致性，以及LeanEvolve自动修订框架，实现验证后的自动修订。实验结果表明，经过验证的工作流性能显著提升，验证了形式化方法在LLM Agent领域的有效性。

一分钟读论文：《Lean4Agent——用依赖类型语言验证 Agent》

Micropaper ·

verified-ledger项目利用Lean 4和Rust进行形式化验证与模糊测试，以确保账本系统的安全性和正确性。通过对比Rust实现与Lean模型的输出，识别潜在漏洞。该项目适合希望在高可靠性系统中引入形式化验证的开发者。

【Rust日报】2026-01-05 verified-ledger：使用 Lean 4 作为模糊测试预言机来验证账本的实现逻辑

Rust.cc ·

麻省理工学院成员获得AI数学资助，以加速数学发现

MIT News - Artificial intelligence ·

DeepSeek发布了用于形式数学证明的Prover-V2开源大语言模型

InfoQ ·

本文介绍了DeepSeek-Prover模型的开发，旨在通过生成大量形式化数学证明数据来提高自动定理证明的效率。该模型结合大型语言模型（LLM）和Lean 4验证器，自动生成和验证数学问题的证明，解决了传统方法的复杂性和效率问题。通过迭代优化，DeepSeek-Prover逐步提升了证明的质量和准确性。

一文速览可证数学定理的DeepSeek-Prover系列模型：从Prover V1、Prover V1.5到DeepSeek-Prover V2

结构之法算法之道 ·

本研究提出FANS框架，旨在提升大语言模型在自然语言数学推理中的推理能力和答案准确性。通过将数学问题转化为Lean4定理，并利用Lean4证明器验证答案，显著提高了答案选择的准确性。

FANS - Formal Answer Selection for Natural Language Math Reasoning Based on Lean4

BriefGPT - AI 论文速递 ·

本研究提出了MA-LoT框架，解决了单一大型语言模型在形式证明中的不足。该框架是首个多智能体Lean4形式定理证明系统，通过结构化互动和长链思维，MiniF2F-Test数据集的准确率达到54.51%，显著优于现有方法，展示了更深的推理能力。

MA-LoT: Multi-Agent Lean-based Long Chain-of-Thought Reasoning Enhances Formal Theorem Proving

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型在自动形式化数学定理中的应用，展示了其将自然语言数学问题转化为形式化说明的能力。研究表明，使用Codex和GPT-4等模型能够有效提高定理证明的准确率，并提出了LeanDojo和ReProver等工具，推动了自动化证明的研究和数学形式化的进展。

数学中的人工智能：在Lean4中执行数学形式化问题解决和定理证明

BriefGPT - AI 论文速递 ·

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

机器之心 ·

Lean 相关

某岛 ·

稍长的 Lean 4 证明之旅

What's new by TerryTao ·

Since the release of my preprint with Tim, Ben, and Freddie proving the Polynomial Freiman-Ruzsa (PFR) conjecture over , I (together with Yael Dillies and Bhavik Mehta) have started a...

Formalizing the proof of PFR in Lean4 using Blueprint: a short tour

What's new by TerryTao ·

数学家陶哲轩在使用Lean4时发现一篇已发表论文中的错误，计划将语言模型与证明助手连接起来。Lean4主要用于写数学证明，也可用于编程。形式验证可减少软件开发中的错误。

数学家陶哲轩在形式证明帮助下发现论文中错误

极道 ·