量子位 ·

谷歌新架构突破Transformer超长上下文瓶颈！Hinton灵魂拷问：后悔Open吗？

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

谷歌在NeurIPS 2025上推出了新架构Titans和MIRAS，突破了Transformer在超长上下文处理中的限制。Titans结合了RNN的速度与Transformer的性能，能够动态更新记忆，扩展上下文至200万token。MIRAS则提供统一的序列建模框架，优化信息整合与记忆更新。这些新架构在处理长序列时优于现有模型，标志着AI领域的重要进展。

🎯

关键要点

谷歌在NeurIPS 2025上推出新架构Titans和MIRAS，突破Transformer在超长上下文处理中的限制。
Titans结合了RNN的速度与Transformer的性能，能够动态更新记忆，扩展上下文至200万token。
MIRAS提供统一的序列建模框架，优化信息整合与记忆更新。
Titans引入新的神经长期记忆模块，能够在推理阶段动态更新权重。
MAC架构将长期记忆作为额外上下文信息，提升模型的表达能力。
Titans通过“意外指标”选择性更新长期记忆，保持快速和高效。
MIRAS将序列模型结构为四个关键设计选择，优化信息的学习与保留。
基于Titans和MIRAS的模型性能优于现有的线性循环模型和Transformer基线模型。
谷歌的研究人员认为公开Transformer的研究对世界产生了积极影响。

❓

延伸问答

谷歌在NeurIPS 2025上推出了哪些新架构？

谷歌在NeurIPS 2025上推出了Titans和MIRAS两项新架构。

Titans架构如何突破Transformer的限制？

Titans结合了RNN的速度与Transformer的性能，能够动态更新记忆，扩展上下文至200万token。

MIRAS的主要目标是什么？

MIRAS的主要目标是让模型在推理阶段也能进行学习，优化信息整合与记忆更新。

Titans架构中的“意外指标”是什么？

“意外指标”是指模型检测到当前记忆内容与新输入内容之间存在较大差异时的度量，用于选择性更新长期记忆。

基于Titans和MIRAS的模型性能如何？

基于Titans和MIRAS的模型性能优于现有的线性循环模型和Transformer基线模型，能够处理极长上下文。

谷歌研究人员对公开Transformer的看法是什么？

谷歌研究人员认为公开Transformer的研究对世界产生了巨大的积极影响。

🏷️

继续阅读

谷歌Gemma 4 12B的性能几乎与26B基准相当——并可在您的笔记本电脑上运行
谷歌推出了Gemma 4 12B模型，旨在为标准笔记本电脑提供高性能的多模态智能。该模型内存占用比Gemma 4 26B小一半，但性能接近，支持本地运行，...
谷歌允许社交媒体明星自定义他们的搜索结果页面
谷歌允许美国的大型创作者和出版商申请专属搜索资料，展示他们的在线内容，如视频和文章。此功能仅限于拥有至少10万YouTube订阅者、10万Instagra...
请求的路径：现代网页架构之旅
现代网页架构中，用户请求在加载网页时可能经过多个系统，每一层都旨在处理流量，形成漏斗，确保大部分流量在到达数据库前已被处理。理解每一层的功能和权衡，有助于...
这次谷歌相册的更新拯救了你的数字相框
谷歌的Ambient API更新使Aura数字相框用户可以自动更新幻灯片库，用户可直接从谷歌相册添加照片或同步整个相册。现有用户需重新连接相册以保持同步，...
线上剧本杀「多房间 + 多角色 + 强流程」的实时音视频架构
线上剧本杀结合多房间、角色权限和严格流程，技术复杂度高于普通视频聊天。关键在于动态音频拓扑、信息隔离和流程引擎。DM可控制房间和广播信息，玩家可在不同房间...
美满电子将为谷歌TPU单元定制开发高效网络芯片并使用英特尔18A制程生产
谷歌与美满电子和英特尔合作，定制网络芯片以提升TPU单元性能。该芯片将由英特尔代工，预计2027年底量产，未来用于新数据中心。同时，谷歌与联发科共同开发T...