MinIO的MemKV通过消除AI重复计算成本，承诺实现95%的GPU利用率提升

The New Stack ·

MinIO的MemKV通过消除AI重复计算成本，承诺实现95%的GPU利用率提升

💡 原文英文，约1300词，阅读约需5分钟。

📝

内容提要

MinIO推出了MemKV，这是一种新的上下文记忆存储，旨在解决AI基础层的数据存储挑战。MemKV通过快速的上下文访问，降低了AI推理工作负载中的重复计算成本，提高了GPU利用率，并降低了每个令牌的成本。这项技术帮助开发者更有效地管理GPU集群中的状态，确保上下文的持久性和共享，从而提升企业AI的效率和安全性。

🎯

关键要点

MinIO推出了MemKV，一种新的上下文记忆存储，旨在解决AI基础层的数据存储挑战。
MemKV通过快速的上下文访问，降低了AI推理工作负载中的重复计算成本，提高了GPU利用率。
MemKV提供持久的共享上下文，支持大规模GPU集群，解决了现有内存和存储层无法满足的需求。
MemKV显著减少了AI推理工作负载中的重复计算税，提升了时间到第一个令牌和每个令牌的成本效益。
开发者可以将会话和代理状态存储在MemKV中，使得任何副本都可以随时接入对话，提升了系统的灵活性和效率。
MemKV的设计使得上下文存储不再依赖于缓存驱逐，能够在微秒级别内持久化和检索上下文。
随着AI系统的持续性和互联性增强，安全性和信任的维护成为新的企业挑战，组织需要保护上下文记忆层。
MemKV通过直接从非易失性内存传输数据到AI数据路径，消除了HTTP开销和存储服务器的需求，优化了推理数据路径。

❓

延伸问答

MemKV是什么，它的主要功能是什么？

MemKV是一种新的上下文记忆存储，旨在解决AI基础层的数据存储挑战，主要功能是通过快速的上下文访问降低AI推理工作负载中的重复计算成本，提高GPU利用率。

MemKV如何提高GPU的利用率？

MemKV通过提供持久的共享上下文，减少了AI推理工作负载中的重复计算税，从而显著提高了GPU的利用率，达到95%以上。

使用MemKV对开发者有什么好处？

开发者可以将会话和代理状态存储在MemKV中，使得任何副本都可以随时接入对话，提升系统的灵活性和效率，减少了对GPU的依赖。

MemKV如何解决AI推理中的重复计算问题？

MemKV通过提供快速的上下文访问，消除了因上下文丢失而导致的重复计算，从而降低了推理工作负载中的计算成本。

MemKV在安全性方面有哪些考虑？

MemKV需要保护上下文记忆层，以维护AI系统的安全性和信任，防止上下文数据被操控或暴露。

MemKV与传统存储解决方案相比有什么优势？

MemKV直接从非易失性内存传输数据到AI数据路径，消除了HTTP开销和存储服务器的需求，优化了推理数据路径，提供更高的效率。

🏷️

继续阅读

Anthropic Launches Claude Platform on AWS
Anthropic has announced the general availability of Claude Platform on AWS, a...
本周，加密货币清晰法案将重返参议院。银行已经在试图阻止它。
美国参议院将重新审议加密货币市场结构法案“清晰法案”，该法案可能导致客户将资金转向稳定币，从而威胁传统银行存款。尽管法案经过妥协，仍对小型社区银行施加压力...
与特朗普的斗争将决定迪士尼新任CEO的成败
迪士尼新任CEO乔什·达马罗面临与特朗普政府的言论自由斗争。迪士尼旗下的ABC指控联邦通信委员会（FCC）侵犯其第一修正案权利，因对节目《The View...
数据质量是人工智能战略
NYU Langone Health通过改进数据收集和管理，推动以数据为驱动的医疗系统。自2017年起，该机构开始现代化数据平台，确保数据质量，统一数据以...
CPS的罗塞塔石：Claroty的AI驱动库
Claroty推出了AI驱动的CPS库，旨在解决网络物理系统的身份危机。研究显示，88%的CPS资产无法准确传输产品代码，导致安全管理困难。该库通过多代理...
Netflix的广告雄心不断壮大
Netflix的广告支持计划预计到2026年将达到每月2.5亿观众，2025年广告收入将达15亿美元。该服务将扩展到15个新国家，并测试个性化广告工具。