量子位 ·

为什么这篇谷歌论文被称为「Attention is all you need」V2

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

谷歌新论文《嵌套学习：深度学习架构的幻象》指出，大型语言模型存在“数字失忆症”，无法有效记忆新知识。研究强调优化器不仅是训练工具，更是记忆系统，提出“嵌套学习”新范式，强调模型深度与更新频率的平衡。新架构HOPE模仿人脑记忆机制，展现了解决持续学习问题的潜力，可能改变AI设计逻辑。

🎯

❓

该论文指出大型语言模型存在数字失忆症，无法有效记忆新知识，并提出了嵌套学习的新范式。

数字失忆症是指大型语言模型无法形成新的长期记忆，导致其在对话中快速遗忘刚学到的知识。

嵌套学习认为有效的智能学习需要深度和频率两个维度，强调模型的层数与更新频率的平衡。

HOPE架构包含多个不同频率的记忆模块，模仿神经科学中信息转移的机制，能够有效处理持续学习问题。

嵌套学习为AI设计提供了新的逻辑和思考框架，可能改变AI的设计逻辑，促进更有效的学习系统。

因为嵌套学习在学术界引发了广泛关注，试图重新审视机器学习的本质，类似于“注意力”机制对序列建模的影响。

🏷️

配备谷歌内置的汽车将因Gemini而变得更智能
Gemini是谷歌助手的升级版，已在配备谷歌内置的汽车中推出。用户可以通过自然对话获取信息、规划行程、管理消息和控制车辆功能。Gemini支持实时更新，帮...
Gemini助手正在向内置谷歌助手的汽车推出
谷歌为内置谷歌助手的汽车推出Gemini AI助手，提供更自然的对话体验。此更新适用于2020年及以后的车型，通过软件更新实现。Gemini可以推荐餐厅、...
在谷歌地图上探索66号公路的新方式
美国66号公路长达2448英里，连接芝加哥和圣塔莫尼卡。为庆祝其100周年，推出两种新方式，帮助人们虚拟或现实中探索这条公路。
拆解微软、谷歌、亚马逊、Meta最新财报：AI变现进入验证期 | 全球深一度
2026年第一季度，微软、谷歌、亚马逊和Meta四大科技巨头财报显示强劲增长。谷歌营收接近1100亿美元，微软AI业务年化收入达370亿美元。市场关注AI...
AI sandboxing is having its Kubernetes moment
Recently, Anthropic announced that its new model, Mythos, had autonomously fo...
微软的Xbox模式现已在所有Windows 11 PC上可用
Microsoft is now rolling out its Xbox mode to all Windows 11 PCs. The new Xbo...