小红花·文摘

Fable在我亲手设计的证明语言中抓出罗素悖论

极道 ·

【公益译文】2026年AI指数报告（四）

绿盟科技技术博客 ·

5篇AI生成的数学论文被接收！00后创始人洪乐潼融资14个亿

量子位 ·

留给人类数学家的悬赏不多了！谷歌DeepMind一口气解决9道埃尔德什问题

量子位 ·

OpenAI的模型成功推翻了平面单位距离问题的核心猜想，展示了深度推理能力，获得数学界高度评价。同时，文章讨论了AI在内容生成中的伦理问题，批评其未经授权使用原创内容，影响创作者生存。谷歌被指控通过直接答案削弱原创内容的价值，可能导致网络生态封闭化。

2026 05 22 HackerNews

介绍 on SuperTechFans ·

Harmonic的创始人Vlad Tenev和Tudor Achim讨论了他们的AI系统Aristotle，该系统在2025年国际数学奥林匹克中获得金牌。Aristotle结合大型变换模型和蒙特卡洛树搜索策略，采用可验证的方法生成数学证明，能够自动验证输出，并在数学推理中表现出色。他们认为数学是理解世界的工具，未来AI将推动科学理论的进步，解决复杂问题。

数学超智能：Harmonic的Vlad和Tudor谈国际数学奥林匹克金牌与一切理论

Josherich的博客 ·

谷歌DeepMind的AlphaProof模型公开了技术细节，团队由10人组成，训练了8000万道数学题。该模型将数学证明视为游戏，利用强化学习和变体生成技术，在2024年国际数学奥林匹克中成功解决多道难题并获得金牌。尽管表现优异，但在处理新定义时仍面临挑战。

Nature公开谷歌IMO金牌模型技术细节！核心团队仅10人，一年给AI编出8000万道数学题训练

量子位 ·

ChatGPT-5能否提供高级数学的证明？

MachineLearningMastery.com ·

谷歌DeepMind的Gemini Deep Think在国际数学奥林匹克中表现出色，完美解决了六道题中的五道，获得35分，达到了金牌标准。这一成就展示了AI在数学推理能力上的重大进步，Gemini模型能够从自然语言问题中生成严谨的数学证明。

谷歌DeepMind的Gemini Deep Think高级版本在国际数学奥林匹克中正式达到了金牌标准

Google DeepMind Blog ·

陶哲轩发布了“喂饭级”AI教程，展示如何利用GitHub Copilot证明函数极限问题。他指出，尽管Copilot能迅速生成代码框架，但复杂的数学细节仍需人工调整，尤其是在处理不等式和绝对值时。他认为传统证明方法在复杂问题中更为有效。

陶哲轩“喂饭级”AI教程来了！只用GitHub Copilot证明函数极限问题

量子位 ·

本研究提出了一种神经符号方法，以提升大型语言模型在数学证明生成中的逻辑推理能力。通过检索类比问题和使用形式验证器，OpenAI o1模型的证明准确性提高了58%-70%。

面向可靠证明生成的LLM：一种神经符号方法

BriefGPT - AI 论文速递 ·

开源人工智能突破使数学证明求解成功率提高52.8%

DEV Community ·

AI突破：自学习数学证明者生成并解决自己的定理

DEV Community ·

本文研究了一种算法，能够生成数学证明，表明训练的Transformer模型在特定输入下被“彻底压制”。该研究为Transformer模型的行为提供了界限，并通过计算辅助证明提供了操作性保证，实验验证了算法在单层Transformer上的有效性。这项工作为确保训练Transformer模型的可靠性迈出了重要一步。

Proving the Complete Suppression of Transformer Models by Designing Input

BriefGPT - AI 论文速递 ·

理所当然也能错，数学界震动：「上下铺猜想」被证伪

机器之心 ·

本文介绍了多种基于大型语言模型的数学证明方法，如NaturalProver、DSP、LeanDojo和DeepSeek-Prover-V1.5。这些方法通过结合自然语言和符号，提高了证明生成的质量和效率，展示了在定理证明中的应用潜力。实验结果显示，这些模型在准确性和自动化程度上均有显著提升。

ImProver：基于智能体的自动化证明优化

BriefGPT - AI 论文速递 ·

AlphaProof和AlphaGeometry 2是新开发的数学推理AI系统，成功解决了国际数学奥林匹克中的四个问题，达到了银牌水平。AlphaProof利用强化学习和形式化语言进行数学证明，而AlphaGeometry 2在几何问题上表现显著提升。这两者的结合展示了AI在数学推理领域的潜力，未来有望帮助数学家探索新假设和解决复杂问题。

人工智能在解决国际数学奥林匹克问题中达到银牌水平

Google DeepMind Blog ·

数学家陶哲轩在使用Lean4时发现一篇已发表论文中的错误，计划将语言模型与证明助手连接起来。Lean4主要用于写数学证明，也可用于编程。形式验证可减少软件开发中的错误。

数学家陶哲轩在形式证明帮助下发现论文中错误

极道 ·

数学证明是通过逻辑步骤验证陈述正确性。验证基于观点和社区标准。数学中的范式变化是例子。数学证明是作者与数学社区协议。数学的危险在于忽视重要性。

为什么数学证明是一种社会契约？

极道 ·