量子位 ·

本想去谷歌捞一笔就跑，却成了改变AI历史的人｜Transformer作者对话Jeff Dean

💡 原文中文，约5200字，阅读约需13分钟。

📝

内容提要

Jeff Dean与Noam Shazeer回顾了谷歌25年的AI发展，讨论了推理算力的未来和模型架构的灵活性。他们认为AI算力相对便宜，未来将采用模块化架构，允许不同团队独立开发。Shazeer提到某些bug可能带来意想不到的积极效果，并分享了在谷歌的快乐时光及对AI潜在风险的担忧。

🎯

关键要点

Jeff Dean与Noam Shazeer回顾了谷歌25年的AI发展历程。
他们讨论了推理算力的未来和模型架构的灵活性。
AI算力相对便宜，未来将采用模块化架构，允许不同团队独立开发。
某些bug可能带来意想不到的积极效果，研究人员可以从中发现新突破。
推理算力Scaling还有很大空间，与AI对话比读书便宜100倍。
推理时间计算的重要性增加可能影响数据中心规划，需要定制硬件。
Gemini 1.5已经开始使用多个大城市的计算资源进行异步训练。
异步训练可以提高整体性能，但可能导致模型参数波动。
记录操作日志可以确保异步训练结果的可重复性。
训练模型时的bug可能会产生正面影响，研究人员通过小规模实验快速验证假设。
AI模型正在经历从单一结构向模块化架构的转变，未来将允许不同团队独立开发不同部分。
未来的模型将采用更有机的结构，通过蒸馏技术不断优化各个模块。
谷歌的AI不仅能检索信息，还能理解和生成复杂内容，未来想象空间巨大。
Jeff Dean和Noam Shazeer分享了在谷歌的快乐时光和有趣经历。
他们对AI潜在风险表示担忧，尤其是AI可能进入不可控的加速改进循环。

❓

延伸问答

Jeff Dean和Noam Shazeer在对话中讨论了哪些AI技术的发展？

他们回顾了谷歌25年的AI发展，讨论了推理算力的未来、模型架构的灵活性以及异步训练等技术。

未来的AI模型架构将如何变化？

未来的模型将采用模块化架构，允许不同团队独立开发不同部分，以提高灵活性和效率。

推理算力的成本优势是什么？

与AI对话的成本比读书便宜约100倍，这为提升AI智能提供了空间。

训练模型时的bug可能带来什么影响？

某些bug可能会产生正面影响，帮助研究人员发现新的改进机会。

异步训练的优势是什么？

异步训练可以提高整体性能，允许模型副本独立计算，减少对持续通信的依赖。

Jeff Dean和Noam Shazeer对AI潜在风险有什么看法？

他们担心AI可能进入不可控的加速改进循环，导致超越人类控制的风险。

🏷️

继续阅读

AI对话开发需要自建吗?还是选开源好
在AI对话系统开发中，选择自建还是开源框架需综合考虑成本、周期和团队能力。自建系统提供完全掌控，但成本高、周期长；开源框架启动快，但灵活性受限。理想选择是...
AI 对话开发难不难？需要哪些知识？(2026 入门路线图)
AI对话开发入门简单，但精通有难度。文字对话需要编程基础，通常一周可上手；实时语音对话则需掌握ASR、TTS和RTC，复杂度更高。使用一体化方案如ZEGO...
什么是 AI 对话开发？AI 对话开发有什么用途？(2026 完整指南)
AI对话开发结合语音识别、大语言模型和语音合成，能够与用户自然交流，广泛应用于智能客服、AI陪伴和在线教育等领域。与传统聊天机器人不同，AI对话能够理解上...
谷歌宣布网站/发布商可以主动退出谷歌搜索AI概览不允许AI概览调用内容
谷歌宣布网站可主动退出其搜索的AI概览和AI模式，以保护网站流量和广告收入。退出后不会影响自然搜索流量，目前仅在英国测试，未来将推广至全球。此举是对因AI...
AI攻防视界：从Mythos破局看漏洞挖掘的工程化跃迁
Mythos Preview模型在漏洞挖掘方面取得重大突破，能够自动发现并串联低危漏洞，生成可验证的PoC代码。该模型在多语言审计中表现出色，真阳性率高达...
谷歌800亿融资，巴菲特久违接盘，背后有什么鬼故事？
谷歌融资847.5亿美元并停止股票回购，以应对未来挑战并囤积现金。巴菲特的伯克希尔哈撒韦投资100亿美元，显示市场对AI的信心。科技巨头们纷纷转向AI基础...