华为云发布EMS弹性内存存储服务,打破AI内存墙

💡 原文中文,约1700字,阅读约需4分钟。
📝

内容提要

华为云发布EMS弹性内存存储服务,解决AI内存墙难题,提升AI推理性能。EMS实现显存扩展、算力卸载和以存代算功能,降低NPU部署数量。华为云还推出AI-Native智算存储解决方案,构建AI Native基础设施。

🎯

关键要点

  • 华为云发布EMS弹性内存存储服务,解决AI内存墙难题,提升AI推理性能。
  • EMS实现显存扩展、算力卸载和以存代算功能,降低NPU部署数量。
  • 显存容量增长速度远远落后于大模型存储需求的增长速度。
  • EMS基于Memory Pooling专利技术,将显存与DRAM进行池化和整合,升级为三层架构。
  • 通过EMS,华为云成功降低了NPU卡的使用数量,提升了大模型推理性能。
  • EMS优化了推理过程中的KV计算,显著降低了推理时延。
  • 华为云形成了EMS弹性内存存储+SFS Turbo弹性文件存储+OBS对象存储的AI-Native智算存储解决方案。
➡️

继续阅读