量子位 ·

11位顶尖数学家发了篇没结果的论文，陶哲轩推荐都关注一下

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

11位顶尖数学家发起AI实验，挑战AI独立解决10道研究级数学难题，探索“AI+数学”的能力。实验旨在检验AI的证明能力，问题来源于真实研究，答案将于2026年公布。

🎯

关键要点

11位顶尖数学家发起AI实验，挑战AI独立解决10道研究级数学难题。
实验旨在探索AI在数学领域的能力边界，问题来源于真实研究。
实验采用First Proof方案，评估AI是否具备独立解决研究级数学问题的能力。
问题全公开但答案不公开，避免数据污染，允许AI使用网络资源。
实验结果显示，当前最佳AI系统难以解答大多数问题，但与人类互动可能提高答案质量。
未来计划设计第二套问题集，逐步探索AI更高阶能力的评测方式。
First Proof的价值在于界定AI当前所能触及的边界，强调人机协作的趋势。

🏷️

继续阅读

库克，终于开口谈了「退休」，但更让他焦虑的是AI
苹果CEO库克在内部会议中表示对AI驱动的新产品感到兴奋，暗示将重塑Siri以支持未来的AI硬件。预计2026年推出智能眼镜和AI Pin等可穿戴设备，依...
“这就是科学！”——麻省理工学院校长在GBH波士顿公共广播中谈论美国科研事业的重要性
麻省理工学院校长萨莉·科恩布斯与GBH的吉姆·布劳德和玛吉·伊根对话，讨论科研压力、科学的重要性及其糖尿病经历。她指出大学面临的财政压力和人才竞争，强调2...
爱泼斯坦如何成为科技影响者
文章探讨了与爱泼斯坦相关的科技巨头，如马斯克和贝索斯，他们与爱泼斯坦的互动程度不同，揭示了富人和权力的运作方式。同时，节目提到Anthropic的广告引发...
给回流技术部门的第三封信
部门信件强调年终奖缺失、过节费发放、工作态度与团队信任的重要性，鼓励老员工探索新技术，拥抱AI，保持创造力，以创业心态对待工作。
人工智能的注意力跨度优秀到不应合法
Ryan与Pathway的CEO Zuzanna和CCO Victor讨论了Baby Dragon Hatchling模型，强调其在持续学习和记忆方面的创...
30亿免单火爆，阿里千问APP登顶App Store榜首！
阿里千问APP推出“春节30亿免单”活动，5小时内突破500万单，迅速登顶App Store免费榜。活动推动奶茶店订单激增，相关股价上涨。千问APP致力于...

11位顶尖数学家发了篇没结果的论文，陶哲轩推荐都关注一下

内容提要

关键要点

标签

继续阅读