Google Titans + MIRAS：终结 AI 健忘症，让模型拥有真正的长期记忆

Micropaper ·

Google Titans + MIRAS：终结 AI 健忘症，让模型拥有真正的长期记忆

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

2017年，Transformer架构引入了注意力机制，但计算成本随着序列长度增加而显著上升。Google Research推出Titans和MIRAS架构，结合RNN的速度与Transformer的准确性，支持超长上下文处理。Titans模仿人脑记忆，采用短期、长期和持久记忆，通过“惊喜度量”选择性更新信息。MIRAS统一序列建模方法，拓展了设计空间，推动AI记忆系统的发展。

🎯

关键要点

2017年，Transformer架构引入了注意力机制，但计算成本随序列长度增加显著上升。
Google Research推出Titans和MIRAS架构，结合RNN的速度与Transformer的准确性，支持超长上下文处理。
Titans模仿人脑记忆，采用短期、长期和持久记忆，通过“惊喜度量”选择性更新信息。
Titans的三层记忆架构包括短期记忆、神经长期记忆和持久记忆。
惊喜度量用于选择性更新重要信息，确保模型只记住新颖和重要的输入。
Titans还引入动量和遗忘机制，确保相关信息被抓住并处理极长序列时有效管理记忆容量。
MIRAS是序列建模的统一理论框架，将各种序列建模方法整合为一个高度复杂的联想记忆模块。
MIRAS拆解序列模型的关键设计选择，包括记忆架构、注意力偏差、保留门和记忆算法。
MIRAS跳出均方误差的框框，提供生成框架探索更丰富的设计空间。
Google研究团队的实验显示，Titans和MIRAS在语言建模和常识推理任务中表现优异。
Titans在处理极长上下文的能力上表现突出，能够有效缩放到超过200万个token的上下文窗口大小。
Titans和MIRAS的应用范围广泛，包括基因组建模、时间序列预测、超长文档理解和多步骤推理。
Titans和MIRAS框架标志着序列建模的重大飞跃，突破了固定大小循环状态的局限，推动AI记忆系统的发展。

❓

延伸问答

Titans和MIRAS架构的主要特点是什么？

Titans结合了RNN的速度与Transformer的准确性，支持超长上下文处理；MIRAS则是统一的序列建模理论框架，整合多种序列建模方法。

Titans如何模仿人脑的记忆机制？

Titans采用短期、长期和持久记忆的三层架构，通过惊喜度量选择性更新重要信息，模仿人脑的记忆分工。

惊喜度量在Titans中有什么作用？

惊喜度量用于选择性更新模型记忆，确保只记住新颖和重要的输入，从而提高记忆效率。

MIRAS框架如何推动序列建模的发展？

MIRAS提供了一个统一的理论框架，揭示了在线优化、联想记忆和架构设计之间的联系，推动了序列建模的创新。

Titans在处理极长上下文时的表现如何？

Titans能够有效缩放到超过200万个token的上下文窗口大小，在极长上下文的任务中表现优异。

Titans和MIRAS的应用场景有哪些？

它们的应用范围包括基因组建模、时间序列预测、超长文档理解和多步骤推理等多个领域。

🏷️

继续阅读

Google DeepMind 发布 Gemma 4 12B：一款无需编码器的多模态模型，支持原生音频
Google DeepMind 发布了 Gemma 4 12B，这是一个无编码器的多模态模型，支持文本、图像、音频和视频处理。该模型在消费级笔记本电脑上运...
在AI工作负载时代如何确保Kubernetes的安全性
Kubernetes的安全性因AI工作负载而变得复杂，传统的集群安全措施已无法应对动态流量。Azure Kubernetes Service（AKS）通过...
Asana称其新的AI“首席助理”将您的Slack混乱转化为可追踪的工作
Asana在伦敦的工作创新峰会上推出了名为Dash的AI助手，旨在提升工作管理平台的效率。Dash能够从会议、Slack和邮件中捕捉待办事项，并将其转化为...
Nvidia最新模型现已上线
Nvidia发布了Nemotron 3 Ultra模型，拥有5500亿参数，支持高达100万标记的上下文窗口。该模型速度显著提升，能节省用户30%的成本。...
Kaggle 使 AI 基准创建变得轻而易举
Kaggle Benchmarks推出本地开发功能，允许开发者在本地环境中创建和验证评估任务。该功能支持使用AI编码代理通过自然语言构建任务，旨在加速AI...
Mate Security的Asaf Wiener让每位后端工程师成为模型路由器。他这样做是正确的。
Mate Security的CEO Asaf Wiener强调AI原生公司的成本管理重要性。他通过细分AI模型的成本，确保每个后端工程师参与模型选择和评估...