Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

机器之心 ·

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

💡 原文中文，约6600字，阅读约需16分钟。

📝

内容提要

谷歌首席科学家Jeff Dean在研讨会上回顾了AI的发展，强调谷歌在神经网络和Transformer等技术上的贡献。他展望AI未来的积极影响，认为随着研究和投资增加，模型能力将提升，改变社会。

🎯

关键要点

Jeff Dean在研讨会上回顾了AI的发展历程，强调谷歌的贡献。
他分享了Gemini系列模型的发展历史，并展望AI的未来积极影响。
机器学习改变了对计算机可能性的期望，规模的增加带来更好的结果。
神经网络和反向传播是深度学习革命的关键构建模块。
谷歌开发了DistBelief系统以支持大规模神经网络训练。
Word2Vec模型的开发使得词的高维表示成为可能。
Transformer模型的提出显著提高了机器翻译的效率。
谷歌的TPU硬件专为神经网络推理而设计，提升了计算速度和能源效率。
开源软件如TensorFlow和Jax推动了AI领域的发展。
Pathways软件简化了大规模计算的部署和运行。
思维链方法提高了模型的推理准确度。
蒸馏技术能够将大型模型的知识转移到小型模型中。
推测式解码技术提高了模型推理速度。
Jeff Dean认为AI将带来深远的社会影响，未来充满希望。

❓

延伸问答

Jeff Dean在演讲中提到的AI发展历程有哪些关键技术？

Jeff Dean提到的关键技术包括神经网络、反向传播、Transformer、蒸馏、MoE等，这些技术都来自谷歌。

Transformer模型的提出对机器翻译有什么影响？

Transformer模型显著提高了机器翻译的效率，使用更少的计算量和模型，获得了比传统模型更好的性能。

什么是蒸馏技术，它的作用是什么？

蒸馏技术是一种将大型模型的知识转移到小型模型中的方法，能够提高小模型的准确性和收敛速度。

谷歌的TPU硬件有什么优势？

谷歌的TPU硬件在神经网络推理方面比传统CPU和GPU快15到30倍，能源效率高30到80倍。

思维链方法如何提高模型的推理准确度？

思维链方法通过鼓励模型生成思考步骤，能够让模型以更细粒度的方式解决问题，从而提高推理准确度。

Jeff Dean对AI未来的看法是什么？

Jeff Dean认为随着研究和投资的增加，AI模型的能力将不断提升，并将在多个领域产生积极影响。

🏷️

继续阅读

谷歌800亿融资，巴菲特久违接盘，背后有什么鬼故事？
谷歌融资847.5亿美元并停止股票回购，以应对未来挑战并囤积现金。巴菲特的伯克希尔哈撒韦投资100亿美元，显示市场对AI的信心。科技巨头们纷纷转向AI基础...
谷歌允许社交媒体明星自定义他们的搜索结果页面
谷歌允许美国的大型创作者和出版商申请专属搜索资料，展示他们的在线内容，如视频和文章。此功能仅限于拥有至少10万YouTube订阅者、10万Instagra...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
刚刚，姚顺雨现身！公开回应腾讯AI落后了吗？
在腾讯云AI产业应用大会上，姚顺雨与汤道生讨论了AI的未来发展。姚顺雨指出，AI的“下半场”应聚焦于解决实际问题和寻找合适的应用场景。他认为腾讯的丰富产品...
犹他州将Gemini教育工具引入全州K-12学校
谷歌与犹他州教育委员会合作，从2026-2027学年起，为全州K-12学校提供免费的Gemini教育AI工具和培训，惠及超过70.8万名学生和教师。该工具...
帮助出版商和创作者在搜索中突出展示他们的作品的新个人资料
谷歌推出搜索个人资料功能，帮助出版商和创作者展示内容，用户可通过移动设备关注创作者以获取更新。符合条件的出版商和创作者可以自定义个人资料，并可能触发知识面...