宝玉的分享 ·

人工智能研究者如何意外发现：我们对“学习”的理解，可能全是错的

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

AI研究者发现，庞大的神经网络挑战了传统学习理论，尽管理论预言大模型会过拟合，但实际却出现了“双下降”现象，模型性能反而提升。这一现象揭示了“彩票假说”，表明大型网络能更好地寻找简单解决方案，重新定义了智能的本质。

🎯

关键要点

庞大的神经网络挑战了传统学习理论，出现了“双下降”现象，模型性能反而提升。
传统理论认为大模型会过拟合，但实际情况表明它们能更好地寻找简单解决方案。
偏差-方差权衡是学习系统的基本原则，模型过于复杂会导致过拟合。
2019年，研究者们扩大模型规模，发现模型性能在过拟合后再次提升，颠覆了传统理论。
彩票假说解释了大型网络成功的原因，认为它们提供了更多寻找简单解决方案的机会。
智能的本质在于发现能够解释复杂现象的优雅模式，而非单纯的记忆信息。
这一发现重新定义了智能，并揭示了科学进步的规律，强调经验主义的重要性。
彩票假说并未推翻经典学习理论，而是揭示了其运作机制的复杂性。
扩大模型规模有效，但也存在天然的边界，额外规模带来的回报会递减。
研究者们的勇气推动了AI的进步，提醒我们拥抱不确定性的重要性。

❓

延伸问答

什么是“双下降”现象？

‘双下降’现象指的是在模型过拟合后，性能意外地再次提升，颠覆了传统学习理论的预期。

彩票假说如何解释大型神经网络的成功？

彩票假说认为大型网络提供了更多寻找简单解决方案的机会，成功并非因复杂性，而是因其内部隐藏的优雅模式。

传统学习理论为何认为大模型会过拟合？

传统理论认为，模型过于复杂会导致过拟合，即只记住训练数据而无法泛化到新问题。

扩大模型规模对AI研究的影响是什么？

扩大模型规模推动了AI研究的进步，使得研究者们能够发现新的能力和解决方案，改变了行业的方向。

这一发现对智能的定义有何影响？

这一发现重新定义了智能，强调智能在于发现能够解释复杂现象的优雅模式，而非单纯的记忆信息。

研究者们如何挑战传统的学习理论？

研究者们通过扩大模型规模，忽视传统理论的警告，最终发现了模型性能的意外提升，挑战了既有的学习理论。

🏷️

继续阅读

每家公司的首个人工智能战略都应该是技能库
企业在实施人工智能时，首要任务是建立“技能图书馆”，记录优秀员工的工作流程和经验，将其转化为可重复使用的技能，以提升AI的实用性和效率，帮助公司更好地利用人工智能。
英国通信管理局（Ofcom）制定人工智能战略，相关研究正在进行中
英国通信管理局（Ofcom）发布了更新的人工智能战略，旨在支持通信行业采用人工智能并应对消费者风险。该战略强调技术中立和结果导向，推动创新并确保安全，包括...
23学习周刊-总第266期-2026年第23周
本周刊聚焦运维、Go语言和Vue技术生态，推荐多个优秀项目，包括基于SwiftUI的Mac终端应用muxy、轻量级剪贴板管理器Buffer和Rust开发的...
PATH计划提升与行业对接的人工智能培训和职业机会
麻省理工学院与乔治亚州立大学合作推出PATH计划，旨在通过建立州级中心，连接大学、社区学院、行业和政府，提供与行业对接的人工智能培训。该计划强调实践学习，...
亚马逊的新游戏计划：詹姆斯·邦德与人工智能史努比狗
亚马逊正在调整游戏战略，专注于云游戏和休闲游戏，特别是通过Luna平台。公司计划推出以詹姆斯·邦德为主题的游戏，并强调视频游戏与影视内容的结合，旨在吸引更...
国家科学基金会续资麻省理工学院主导的人工智能与物理学研究所，扩展新的发现模式
麻省理工学院主导的人工智能与基础相互作用研究所（IAIFI）获得国家科学基金会续资，年资助额从400万美元增至498万美元。IAIFI致力于将人工智能与物...