小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Harmonic的创始人Vlad Tenev和Tudor Achim讨论了他们的AI系统Aristotle,该系统在2025年国际数学奥林匹克中获得金牌。Aristotle结合大型变换模型和蒙特卡洛树搜索策略,采用可验证的方法生成数学证明,能够自动验证输出,并在数学推理中表现出色。他们认为数学是理解世界的工具,未来AI将推动科学理论的进步,解决复杂问题。

数学超智能:Harmonic的Vlad和Tudor谈国际数学奥林匹克金牌与一切理论

Josherich的博客
Josherich的博客 · 2026-02-18T00:00:01Z

谷歌DeepMind的AlphaProof模型公开了技术细节,团队由10人组成,训练了8000万道数学题。该模型将数学证明视为游戏,利用强化学习和变体生成技术,在2024年国际数学奥林匹克中成功解决多道难题并获得金牌。尽管表现优异,但在处理新定义时仍面临挑战。

Nature公开谷歌IMO金牌模型技术细节!核心团队仅10人,一年给AI编出8000万道数学题训练

量子位
量子位 · 2025-11-13T07:55:51Z
ChatGPT-5能否提供高级数学的证明?

本文探讨了GPT-5在解决中高级数学问题方面的能力,特别是线性方程组的解法和数学证明的构建。GPT-5在AIME 2025国际会议上取得了94.6%的数学问题解决成功率,展示了其在逻辑推理和分析方面的显著进步。尽管回应风格仍显机械,但在数学证明的结构和逻辑上表现出色。

ChatGPT-5能否提供高级数学的证明?

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-07T11:00:29Z

谷歌DeepMind的Gemini Deep Think在国际数学奥林匹克中表现出色,完美解决了六道题中的五道,获得35分,达到了金牌标准。这一成就展示了AI在数学推理能力上的重大进步,Gemini模型能够从自然语言问题中生成严谨的数学证明。

谷歌DeepMind的Gemini Deep Think高级版本在国际数学奥林匹克中正式达到了金牌标准

Google DeepMind Blog
Google DeepMind Blog · 2025-07-21T16:30:00Z

陶哲轩发布了“喂饭级”AI教程,展示如何利用GitHub Copilot证明函数极限问题。他指出,尽管Copilot能迅速生成代码框架,但复杂的数学细节仍需人工调整,尤其是在处理不等式和绝对值时。他认为传统证明方法在复杂问题中更为有效。

陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

量子位
量子位 · 2025-05-20T07:57:07Z

本研究提出了一种神经符号方法,以提升大型语言模型在数学证明生成中的逻辑推理能力。通过检索类比问题和使用形式验证器,OpenAI o1模型的证明准确性提高了58%-70%。

面向可靠证明生成的LLM:一种神经符号方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z
开源人工智能突破使数学证明求解成功率提高52.8%

Goedel-Prover是一种新型开源自动定理证明模型,结合了大型语言模型与符号推理能力,在多个数学证明基准上成功率提高了52.8%。

开源人工智能突破使数学证明求解成功率提高52.8%

DEV Community
DEV Community · 2025-02-13T09:40:45Z
AI突破:自学习数学证明者生成并解决自己的定理

本文总结了研究论文《AI突破:自学习数学证明者生成并解决自己的定理》。提出了一种迭代自我对弈的方法,使大型语言模型生成训练数据,结合自动猜想和证明,显著提升定理证明能力,能够在复杂数学问题上实现无监督学习。

AI突破:自学习数学证明者生成并解决自己的定理

DEV Community
DEV Community · 2025-02-09T06:54:13Z

本文研究了一种算法,能够生成数学证明,表明训练的Transformer模型在特定输入下被“彻底压制”。该研究为Transformer模型的行为提供了界限,并通过计算辅助证明提供了操作性保证,实验验证了算法在单层Transformer上的有效性。这项工作为确保训练Transformer模型的可靠性迈出了重要一步。

Proving the Complete Suppression of Transformer Models by Designing Input

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z
理所当然也能错,数学界震动:「上下铺猜想」被证伪

数学家们推翻了双层床猜想,证明在某些图中,从下铺到上铺的路径概率并不总是更高。这一结果挑战了数学直觉,强调了质疑假设的重要性,并引发了对数学证明本质的讨论。

理所当然也能错,数学界震动:「上下铺猜想」被证伪

机器之心
机器之心 · 2024-11-02T07:00:15Z

本研究提出了一个统一框架,将函数与表示结合,解决认知架构中内存与程序模型分离的问题。通过数学定义和证明,分析了框架的实现与应用,促进认知计算的发展。

函数-表示统一框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

研究显示,GPT-4能重复和改编数学证明,但不真正理解数学概念。它处理数学定理的方式像搜索引擎,可能导致错误推断。

模型可以并且应该拥抱人类生成数学的交流性质

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

AlphaProof和AlphaGeometry 2是新开发的数学推理AI系统,成功解决了国际数学奥林匹克中的四个问题,达到了银牌水平。AlphaProof利用强化学习和形式化语言进行数学证明,而AlphaGeometry 2在几何问题上表现显著提升。这两者的结合展示了AI在数学推理领域的潜力,未来有望帮助数学家探索新假设和解决复杂问题。

人工智能在解决国际数学奥林匹克问题中达到银牌水平

Google DeepMind Blog
Google DeepMind Blog · 2024-07-25T15:29:00Z

数学家陶哲轩在使用Lean4时发现一篇已发表论文中的错误,计划将语言模型与证明助手连接起来。Lean4主要用于写数学证明,也可用于编程。形式验证可减少软件开发中的错误。

数学家陶哲轩在形式证明帮助下发现论文中错误

极道
极道 · 2023-10-27T22:33:00Z

数学证明是通过逻辑步骤验证陈述正确性。验证基于观点和社区标准。数学中的范式变化是例子。数学证明是作者与数学社区协议。数学的危险在于忽视重要性。

为什么数学证明是一种社会契约?

极道
极道 · 2023-09-08T23:47:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码