机器之心 ·

上海AI Lab最新推出Mixture-of-Memories：线性注意力也有稀疏记忆了

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

AIxiv专栏促进了学术交流，报道了2000多篇文章。文章探讨了未来模型架构需具备强大记忆扩展能力和低复杂度，提出了MoM（Mixture-of-Memories）方法，通过稀疏激活和共享记忆提升性能，尤其在长序列建模任务中表现突出。

🎯

❓

Mixture-of-Memories（MoM）是一种通过稀疏激活和共享记忆来提升模型性能的方法，特别适用于长序列建模任务。

MoM在长序列建模任务中表现突出，尤其在1.3B模型上与Transformer架构相当。

MoM通过router分发token，维护多个KV memory，实现memory维度的扩展。

MoM在推理效率上展现出常数级复杂度的优势，并且在in-context recall-intensive任务上表现优于其他线性方法。

MoM的硬件高效实现可以复用现有算子，优化计算过程，提升效率。

MoM在推理效率上表现出强大的优势，具有常数级复杂度，显存占用也较低。

🏷️

知识图谱+本地存储：开源Mnemo给AI配的长期记忆中枢
Mnemo是为大语言模型设计的本地优先长期记忆层，旨在解决AI每次会话忘记上下文的问题。它通过构建知识图谱存储历史对话和信息，帮助AI在后续提问中自动召回...
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
AI初创公司Quilty声称通过剧本分析预测电影票房成功，但实际测试结果不佳，预测不准确。Quilty结合多种AI工具提供剧本分析和成功概率评分，旨在帮助...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
您的AI费用失控了。Cloudflare现在可以解决这个问题。
Cloudflare推出AI Gateway，帮助企业控制AI支出。新功能包括预算限制和身份驱动的支出管理，允许按用户、团队或模型设置预算。通过集中管理，...
2026年数据与AI峰会：金融服务领导者的内部指南
2026年数据与AI峰会将于6月15日至18日在旧金山举行，聚焦金融服务行业的AI转型与现代化，主要议题包括保险承保、负责任的AI应用及资本市场智能化。与...
Presentation: Platform Teams Enabling AI - MCP/Multi-Agentic Tools Across Linkedin
LinkedIn’s Karthik Ramgopal and Prince Valluri discuss leveraging AI as a new...