DeepSeek Engram：颠覆GPU内存瓶颈！把知识存储从计算中分离，O(1)查找效率！

Micropaper ·

DeepSeek Engram：颠覆GPU内存瓶颈！把知识存储从计算中分离，O(1)查找效率！

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

DeepSeek与北大团队推出的Engram系统，通过分离静态知识存储与动态推理，实现O(1)查找效率，降低了对昂贵GPU内存的需求。这一创新在普通DRAM中存储大量知识，提升了大模型的性能和成本效益，尤其对中国AI公司具有重要意义。

🎯

关键要点

DeepSeek与北大团队推出Engram系统，分离静态知识存储与动态推理。
Engram实现O(1)查找效率，降低对昂贵GPU内存的需求。
该系统在普通DRAM中存储大量知识，提升大模型性能和成本效益。
当前大模型面临GPU内存昂贵、资源浪费等问题。
Engram通过条件内存系统解决静态知识和动态推理的分离问题。
Engram的核心思想是将经典N-gram嵌入现代化，实现O(1)查找。
Engram模块从静态内存中检索N-gram知识，具有确定性寻址和DRAM卸载特性。
实验结果显示，Engram在知识、推理、代码和数学任务上均有一致改进。
Engram降低硬件门槛，突破内存限制，对中国AI公司尤为重要。
未来可能出现内存-计算分离、多轴稀疏性和专用硬件加速器等新方向。

🏷️

继续阅读

Supermicro发布上下文内存存储服务器
Supermicro发布了首批上下文内存(CMX)存储服务器，旨在加速AI生命周期，解决长时AI查询和多阶段工作负载的挑战。该产品基于NVIDIA STX...
介绍AI Runtime：在Databricks上可扩展的无服务器NVIDIA GPU用于训练和微调
我们很高兴宣布AI Runtime（AIR）公共预览版上线。AIR支持A10和H100的按需分布式GPU训练，已被多家客户用于深度学习模型的训练和生产，应...
阿里财报电话会：平头哥GPU芯片已累计规模化交付47万片
阿里巴巴财报电话会上透露，平头哥GPU芯片已交付47万片，60%以上用于外部客户，支持400多家企业的AI任务，涵盖多个行业。
全网猜了一周 DeepSeek V4，结果是小米干的
小米发布了三款新模型：Hunter Alpha、Healer Alpha 和 MiMo-V2 系列，旨在提升 AI 任务执行能力。Hunter Alpha...
在线教程丨狂揽7.7万stars，LLM Course覆盖从入门到进阶的干货知识与实战课程
本文介绍了使用OpenCV进行文档图像自动矫正的方法，主要通过透视变换将倾斜照片转换为正面矩形视图。核心步骤包括图像预处理、轮廓检测和透视变换，提供了Py...
英伟达重启面向中国的AI芯片生产；美光财季营收大幅增长近2倍展望乐观；阿里云AI算力和存储产品涨价
英伟达重启中国AI芯片生产，美光科技营收大幅增长，三星为AMD提供HBM4内存，苹果COO访问深圳供应链，阿里云产品涨价，泡泡玛特与索尼影业合作开发LABUBU动画电影。

DeepSeek Engram：颠覆GPU内存瓶颈！把知识存储从计算中分离，O(1)查找效率！

内容提要

关键要点

标签

继续阅读