DeepSeek Engram：颠覆GPU内存瓶颈！把知识存储从计算中分离，O(1)查找效率！

Micropaper ·

DeepSeek Engram：颠覆GPU内存瓶颈！把知识存储从计算中分离，O(1)查找效率！

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

DeepSeek与北大团队推出的Engram系统，通过分离静态知识存储与动态推理，实现O(1)查找效率，降低了对昂贵GPU内存的需求。这一创新在普通DRAM中存储大量知识，提升了大模型的性能和成本效益，尤其对中国AI公司具有重要意义。

🎯

关键要点

DeepSeek与北大团队推出Engram系统，分离静态知识存储与动态推理。
Engram实现O(1)查找效率，降低对昂贵GPU内存的需求。
该系统在普通DRAM中存储大量知识，提升大模型性能和成本效益。
当前大模型面临GPU内存昂贵、资源浪费等问题。
Engram通过条件内存系统解决静态知识和动态推理的分离问题。
Engram的核心思想是将经典N-gram嵌入现代化，实现O(1)查找。
Engram模块从静态内存中检索N-gram知识，具有确定性寻址和DRAM卸载特性。
实验结果显示，Engram在知识、推理、代码和数学任务上均有一致改进。
Engram降低硬件门槛，突破内存限制，对中国AI公司尤为重要。
未来可能出现内存-计算分离、多轴稀疏性和专用硬件加速器等新方向。

❓

延伸问答

Engram系统的主要创新是什么？

Engram系统通过分离静态知识存储与动态推理，实现了O(1)查找效率，降低了对昂贵GPU内存的需求。

Engram如何提高大模型的性能和成本效益？

Engram在普通DRAM中存储大量知识，降低了对HBM内存的需求，从而提升了大模型的性能和成本效益。

Engram的查找效率如何？

Engram实现O(1)查找效率，查找时间复杂度不随模型规模增长。

Engram系统如何解决GPU内存瓶颈问题？

Engram通过将静态知识存储卸载到普通DRAM中，减少了对昂贵GPU内存的依赖，从而解决了内存瓶颈问题。

Engram的实验结果显示了什么？

实验结果显示，Engram在知识、推理、代码和数学任务上均有一致的性能提升。

Engram对中国AI公司的重要性是什么？

Engram降低了硬件门槛，突破了内存限制，对受出口限制的中国AI公司尤为重要。

🏷️

继续阅读

便宜好用真香！美国企业把DeepSeek买上了趋势榜第一
Ramp发布的2026年热门软件供应商榜单显示，中国AI公司DeepSeek首次重返增长，企业采用率为0.1%。其成本显著低于Anthropic和Open...
Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
分析中的行存储与列存储：为什么PostgreSQL的扫描速度比应有的慢
本文讨论了Postgres在处理时间序列数据时的存储效率，指出行存储模型导致的I/O浪费。通过计算读取放大比，分析存储布局对查询的影响。建议采用混合存储模...
提高文本处理和实体识别效率的三种SpaCy技巧
本文探讨了优化spaCy以提高自然语言处理效率的三种技巧：选择性加载和禁用组件以减少计算开销，使用nlp.pipe进行高吞吐量批处理以利用多核并行处理，以...
法国量子计算公司Quobly完成1.15亿欧元A轮融资
法国量子计算公司Quobly完成1.15亿欧元A轮融资，主要投资者包括Bpifrance和意法半导体。融资将用于研发和国际扩展，计划于2026年底推出首台...
知识图谱+本地存储：开源Mnemo给AI配的长期记忆中枢
Mnemo是为大语言模型设计的本地优先长期记忆层，旨在解决AI每次会话忘记上下文的问题。它通过构建知识图谱存储历史对话和信息，帮助AI在后续提问中自动召回...