量子位 ·

谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

谷歌DeepMind的AlphaGeometry2成功解决了2000-2024年IMO竞赛中84%的几何问题，超越金牌得主的平均水平。在50道题中完成42道，显著提升了推理能力和算法效率。尽管表现优异，AlphaGeometry2尚未开源，未来将参加2025年澳大利亚的IMO竞赛。

🎯

🔎

AlphaGeometry2在解决IMO几何问题中取得的84%成功率，标志着AI在数学推理领域的重大进步。这不仅展示了AI的潜力，也为未来的数学教育和研究提供了新的视角，可能会影响人类对几何问题的理解和解决方式。

AlphaGeometry2的四大技术升级显著提升了其性能，尤其是扩展的领域专用语言和DDAR2引擎的改进。这些技术进步使得AI能够处理更复杂的几何问题，未来可能会推动更多领域的AI应用，尤其是在科学研究和工程设计中。

尽管AlphaGeometry2表现出色，但其未开源的状态可能限制了其在更广泛领域的应用。未来的AI数学竞赛AIMO要求开源才能参与，这可能促使更多团队开发开源的AI系统，从而推动整个领域的进步和创新。

❓

AlphaGeometry2成功解决了2000-2024年IMO竞赛中84%的几何问题，在50道题中完成了42道，超越金牌得主的平均水平。

AlphaGeometry2相比于上一代多完成了15道题，主要通过扩展领域专用语言、升级符号推理引擎DDAR2、全新搜索算法SKEST和更强大的语言模型Gemini实现改进。

DDAR2增加了处理不同名称但相同坐标的点的能力，算法速度提升，并且代码实现从Python改为C++，速度快了300倍。

SKEST算法通过多个配置的搜索树并行运行，利用知识共享机制相互启发，从而更高效地寻找证明路径。

Gemini语言模型采用三种训练方法，包括领域专用语言的自定义分词器预训练、自然语言微调和多模态训练，实验表明代数推理是解决几何问题的核心。

AlphaGeometry2将参加2025年在澳大利亚举行的IMO竞赛。

🏷️