小红花·文摘

AI 明白圆是圆的吗？

木遥的窗子 ·

字节推出的Seed-Prover模型在数学推理方面表现优异，解决了78.1%的国际数学奥林匹克（IMO）难题，并在普特南数学竞赛中取得显著成绩。该模型结合引理式证明和Seed-Geometry引擎，建立了独特的几何问题库，达到了IMO银牌水平。

字节Seed数学新模型，SOTA了

量子位 ·

本研究提出了TrustGeoGen，一个可扩展的正式验证数据引擎，旨在解决几何问题求解中的不足。该引擎通过多模态对齐生成和形式验证，显著提高了模型的逻辑一致性和泛化能力。

TrustGeoGen: A Scalable and Formally Verified Data Engine for Reliable Multi-modal Geometric Problem Solving

BriefGPT - AI 论文速递 ·

本研究提出GeoSense，旨在评估多模态大型语言模型（MLLMs）在几何问题解决中的推理能力。研究表明，几何原理的识别与应用仍是提升MLLMs推理能力的瓶颈，为未来研究指明方向。

GeoSense: Evaluating the Identification and Application of Geometric Principles in Multimodal Reasoning

BriefGPT - AI 论文速递 ·

谷歌DeepMind的AlphaGeometry2 AI实现金牌数学奥林匹克表现

InfoQ ·

谷歌DeepMind的AlphaGeometry2成功解决了2000-2024年IMO竞赛中84%的几何问题，超越金牌得主的平均水平。在50道题中完成42道，显著提升了推理能力和算法效率。尽管表现优异，AlphaGeometry2尚未开源，未来将参加2025年澳大利亚的IMO竞赛。

谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

量子位 ·

本研究提出了GeoX模型，旨在提升多模态大型语言模型在几何问题解决中的能力。通过单模态预训练和几何-语言对齐，GeoX在几何图像理解与推理方面表现优异，超越了多个基准测试中的现有模型。

GeoX：通过统一形式化视觉-语言预训练解决几何问题

BriefGPT - AI 论文速递 ·

本研究提出了一种基于课程学习的单目视觉里程计模型，旨在解决几何问题并提升性能。实验结果表明，该模型在复杂环境中的表现优于现有方法，验证了课程学习在视觉里程计中的有效性。

Robust Monocular Visual Odometry Based on Curriculum Learning

BriefGPT - AI 论文速递 ·

2024 年高联二试的几何题解答

如鱼饮水 ·

本文介绍了多种基于神经网络的几何问题求解方法，如PGPSNet、FGeoDRL和FGeo-P，旨在提高几何推理的准确性和效率。研究构建了PGPS9K数据库，并通过实验验证了这些模型在不同数据集上的优越性能，推动了几何问题求解的进展。

利用全息推理解决带几何图形的代数问题

BriefGPT - AI 论文速递 ·

AlphaProof和AlphaGeometry 2是新开发的数学推理AI系统，成功解决了国际数学奥林匹克中的四个问题，达到了银牌水平。AlphaProof利用强化学习和形式化语言进行数学证明，而AlphaGeometry 2在几何问题上表现显著提升。这两者的结合展示了AI在数学推理领域的潜力，未来有望帮助数学家探索新假设和解决复杂问题。

首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

机器之心 ·

本文介绍了多模态模型G-LLaVA和ShareGPT4V数据集的开发，提升了几何问题的解决能力。通过高质量标题的扩展，显著提高了多种模型的基准测试表现。GPT-4V在视觉推理和异态检测任务中展现出潜力，推动了多模态学习的发展。

GeoGPT4V：朝向具有几何图像生成能力的几何多模式大型语言模型

BriefGPT - AI 论文速递 ·

本文介绍了多个几何问题求解模型和数据集的进展，包括Geo170K、GeoQA和GAPS等。研究表明，GAPS模型在几何问题解决上表现优越，特别是在证明任务中达到97.5%的准确率。此外，FGeo-P定理预测器显著提高了解决率。通过构建UniGeo和GeoEval基准，评估了大型语言模型在几何推理中的表现，发现其在复杂问题上的能力仍需提升。

GOLD: 几何问题解决器与自然语言描述

BriefGPT - AI 论文速递 ·

本文介绍了基于Geoformer框架的几何问题基准测试UniGeo，提出了几何形式化理论（GFT）和形式几何问题解决器（FGPS），实现了高效的几何问题求解。研究表明，结合深度学习和符号推理可显著提高解题准确率，尤其在国际数学奥林匹克（IMO）级别的几何问题上。

吴氏方法可使符号人工智能超越银牌，AlphaGeometry 在 IMO 几何竞赛中表现优异，超过金牌得主

BriefGPT - AI 论文速递 ·

研究评估了多模态模型在数学推理中的能力，发现其在几何问题，尤其是复杂推理链方面表现不佳。通过创建基准测试（如GeoEval和MathVista），分析了不同模型的性能，并强调了进一步发展的必要性。研究还提出了新的多模态模型ModaVerse，显著提高了数据处理效率。

MathVerse: 您的多模式 LLM 真正看到视觉数学问题中的图表吗？

BriefGPT - AI 论文速递 ·

AlphaGeometry是谷歌DeepMind的一种AI系统，结合了神经语言模型和符号推演引擎，能够解决复杂的几何问题。在国际奥林匹克数学竞赛中，AlphaGeometry表现出色，解决了25道题，超过了之前的方法和人类平均水平。虽然算力优势带来了强大的模型性能，但实际应用价值更重要。AlphaGeometry在教学和科研方面有潜力，但AI工具的特异性和统一性仍是挑战。AI for Science需要降低使用门槛和提升科研人员的能力。