小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI 明白圆是圆的吗?

文章探讨了AI模型在解决几何问题时的思维方式,特别是GPT-5成功证明了一个数学命题。许多模型缺乏几何直觉,思考仅停留在文字层面,无法有效理解概念。尽管现代数学不依赖三维直觉,但在低维问题中,几何直觉仍然重要。文章提出AI是否能通过文本训练获得这种直觉,反映人类与AI在知识获取上的根本差异。

AI 明白圆是圆的吗?

木遥的窗子
木遥的窗子 · 2025-08-12T10:32:04Z
AI 明白圆是圆的吗?

文章探讨了AI模型在解决几何问题时的思维方式,特别是GPT 5的成功与其他模型的失败。失败的模型缺乏几何直觉,限制了它们对问题的理解和证明能力。尽管现代数学不依赖直观,但在低维几何中,几何直觉仍然重要。文章提出AI是否能通过文本训练获得这种直觉,反映了人类与AI在知识获取上的根本差异。

AI 明白圆是圆的吗?

木遥的窗子
木遥的窗子 · 2025-08-12T10:32:04Z

字节推出的Seed-Prover模型在数学推理方面表现优异,解决了78.1%的国际数学奥林匹克(IMO)难题,并在普特南数学竞赛中取得显著成绩。该模型结合引理式证明和Seed-Geometry引擎,建立了独特的几何问题库,达到了IMO银牌水平。

字节Seed数学新模型,SOTA了

量子位
量子位 · 2025-08-04T09:13:05Z

本研究提出了TrustGeoGen,一个可扩展的正式验证数据引擎,旨在解决几何问题求解中的不足。该引擎通过多模态对齐生成和形式验证,显著提高了模型的逻辑一致性和泛化能力。

TrustGeoGen: A Scalable and Formally Verified Data Engine for Reliable Multi-modal Geometric Problem Solving

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究提出GeoSense,旨在评估多模态大型语言模型(MLLMs)在几何问题解决中的推理能力。研究表明,几何原理的识别与应用仍是提升MLLMs推理能力的瓶颈,为未来研究指明方向。

GeoSense: Evaluating the Identification and Application of Geometric Principles in Multimodal Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z
谷歌DeepMind的AlphaGeometry2 AI实现金牌数学奥林匹克表现

Google DeepMind的AlphaGeometry2(AG2)AI模型成功解决了84%的国际数学奥林匹克几何问题,超越了人类金牌选手的平均水平。AG2是AlphaGeometry(AG1)的升级版,采用了领域特定的形式语言和符号推理引擎。尽管表现优异,AG2仍有提升空间,尚未解决所有问题。

谷歌DeepMind的AlphaGeometry2 AI实现金牌数学奥林匹克表现

InfoQ
InfoQ · 2025-02-25T14:00:00Z

谷歌DeepMind的AlphaGeometry2成功解决了2000-2024年IMO竞赛中84%的几何问题,超越金牌得主的平均水平。在50道题中完成42道,显著提升了推理能力和算法效率。尽管表现优异,AlphaGeometry2尚未开源,未来将参加2025年澳大利亚的IMO竞赛。

谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

量子位
量子位 · 2025-02-08T04:53:57Z

本研究提出了GeoX模型,旨在提升多模态大型语言模型在几何问题解决中的能力。通过单模态预训练和几何-语言对齐,GeoX在几何图像理解与推理方面表现优异,超越了多个基准测试中的现有模型。

GeoX:通过统一形式化视觉-语言预训练解决几何问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究提出了一种基于课程学习的单目视觉里程计模型,旨在解决几何问题并提升性能。实验结果表明,该模型在复杂环境中的表现优于现有方法,验证了课程学习在视觉里程计中的有效性。

Robust Monocular Visual Odometry Based on Curriculum Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z
2024 年高联二试的几何题解答

本文讨论了四点共圆的条件,提出了两种证明思路:相似三角形和面积比例证明,以及反演变换。总结了两种思路的证明步骤。

2024 年高联二试的几何题解答

如鱼饮水
如鱼饮水 · 2024-09-08T12:50:48Z

本文介绍了基于神经网络的解题方案PGPSNet,用于解决几何问题求解中的模态融合问题。通过将图解转化为文本描述,并结合训练、数据增强和自限制解码等方法,提升几何理解和推理能力。研究者构建了PGPS9K数据库来支持研究,并在PGPS9K和Geometry3K数据集上进行了实验证明该方法的优越性。

利用全息推理解决带几何图形的代数问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

AlphaProof和AlphaGeometry 2是新开发的数学推理AI系统,成功解决了国际数学奥林匹克中的四个问题,达到了银牌水平。AlphaProof利用强化学习和形式化语言进行数学证明,而AlphaGeometry 2在几何问题上表现显著提升。这两者的结合展示了AI在数学推理领域的潜力,未来有望帮助数学家探索新假设和解决复杂问题。

人工智能在解决国际数学奥林匹克问题中达到银牌水平

Google DeepMind Blog
Google DeepMind Blog · 2024-07-25T15:29:00Z
首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

AI数学奥林匹克比赛冠军团队使用了NuminaMath 7B TIR模型,该模型是deepseek-math-7b-base的微调版本。第二名和第三名团队也使用了DeepSeek-Math-7B-RL模型,但微调了不同的参数。前四名团队都选择了DeepSeekMath-7B作为基础模型。NuminaMath 7B TIR模型在数学问题推理方面表现出色,但在几何问题上存在一定困难。

首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

机器之心
机器之心 · 2024-07-11T08:11:48Z

AlphaGeometry是谷歌DeepMind的一种AI系统,结合了神经语言模型和符号推演引擎,能够解决复杂的几何问题。在国际奥林匹克数学竞赛中,AlphaGeometry表现出色,解决了25道题,超过了之前的方法和人类平均水平。虽然算力优势带来了强大的模型性能,但实际应用价值更重要。AlphaGeometry在教学和科研方面有潜力,但AI工具的特异性和统一性仍是挑战。AI for Science需要降低使用门槛和提升科研人员的能力。

AlphaGeometry:DeepMind 大算力再造奇迹,但「算力代替智力」或许并非最优解

HyperAI超神经
HyperAI超神经 · 2024-01-20T02:59:00Z
AlphaGeometry:一款具有奥林匹克水平的几何 AI 系统 [译]

我们的AI系统AlphaGeometry在几何问题解决方面取得了重大突破,能够解决复杂几何问题,接近人类奥林匹克金牌选手的水平。通过结合神经语言模型和基于规则的演绎引擎,AlphaGeometry能够有效地找到解决方案。我们开发了一种生成大量合成训练数据的方法,克服了数据瓶颈问题。AlphaGeometry的成功展示了AI在数学推理领域的进步,为开发具有深度数学推理能力的更先进和通用AI系统迈出了重要一步。我们计划开源AlphaGeometry的代码和模型,为数学、科学和AI领域带来新的可能性。

AlphaGeometry:一款具有奥林匹克水平的几何 AI 系统 [译]

宝玉的分享
宝玉的分享 · 2024-01-17T13:00:00Z

大语言模型在多步数学推理方面表现出色,但需要评估视觉语言模型的推理能力。通过几何问题的镜头,我们评估了视觉语言模型的推理能力。创建了一个合成的几何问题数据集,进行系统评估。结果表明,这些模型在几何等主题的推理能力上并不如先前的基准测试所暗示的那样出色。释放这个数据集供进一步研究使用。

GeomVerse:几何推理的大型模型的系统评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-19T00:00:00Z

本研究提出了DreaMo,一种从单个且视角覆盖不完整的网络视频中重建关节3D形状的方法。通过使用条件视图扩散先验和定制的正则化方法解决了低视角覆盖区域带来的挑战,并引入了骨架生成策略生成可解释的人体骨架。研究结果表明DreaMo在新视角渲染、详细关节形状重建和骨架生成方面具有良好的质量,并且能够解决视角覆盖不完整导致的几何问题。

DreaMo: 从单个非正式视频进行关节 3D 重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-05T00:00:00Z
Luogu P1995. [NOI2011] 智能车比赛

本文讨论了两个几何问题的解决方法:动态规划和缩小区域。动态规划方法的时间复杂度为O(n^3),用于判断两点之间是否可达。缩小区域方法的时间复杂度为O(n^2),同样用于判断两点之间是否可达。文章还提到了使用平衡树来维护可通过的区域。

Luogu P1995. [NOI2011] 智能车比赛

某岛
某岛 · 2023-06-09T10:41:13Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码