如何在保密虚拟机中获得裸金属GPU性能

如何在保密虚拟机中获得裸金属GPU性能

💡 原文英文,约1100词,阅读约需4分钟。
📝

内容提要

在2025年OpenInfra峰会上,NVIDIA强调AI开发者应结合Kata Containers和保密计算,以安全地在GPU上运行敏感工作负载。Kata提供轻量级虚拟机隔离,保密计算确保内存数据加密,防止云服务商访问模型和数据。NVIDIA致力于平衡GPU性能与安全性,支持PCIe拓扑和设备映射,以优化AI工作负载。

🎯

关键要点

  • 在2025年OpenInfra峰会上,NVIDIA强调AI开发者需要结合Kata Containers和保密计算,以安全地在GPU上运行敏感工作负载。
  • Kata Containers是一个开源项目,结合轻量级虚拟机和容器运行时,提供强隔离性。
  • 保密计算提供内存数据和应用程序加密,确保云服务商无法访问模型和数据。
  • NVIDIA致力于在GPU性能与安全性之间取得平衡,支持PCIe拓扑和设备映射以优化AI工作负载。
  • NVIDIA的虚拟化参考架构(VRA)解决了PCIe拓扑和GPU间通信的问题,支持两种方法:扁平化层次和主机拓扑复制。
  • NVIDIA与Red Hat、IBM及开源Kata社区合作,推动VRA及工具的上游开发。
  • 结合Kata和保密计算并非万无一失,仍存在理论上的VM突破风险,但显著降低了云服务商访问敏感数据的机会。
  • NVIDIA的方案将推动新的AI堆栈,结合轻量级VM隔离、硬件内存加密和GPU设备映射抽象。

延伸问答

NVIDIA在2025年OpenInfra峰会上提出了什么关键建议?

NVIDIA建议AI开发者结合Kata Containers和保密计算,以安全地在GPU上运行敏感工作负载。

Kata Containers的主要功能是什么?

Kata Containers结合轻量级虚拟机和容器运行时,提供强隔离性和性能优势。

保密计算如何增强数据安全性?

保密计算通过内存数据和应用程序加密,确保云服务商无法访问模型和数据。

NVIDIA的虚拟化参考架构(VRA)解决了什么问题?

VRA解决了PCIe拓扑和GPU间通信的问题,支持不同的拓扑方法。

结合Kata和保密计算的风险是什么?

尽管降低了云服务商访问敏感数据的机会,但仍存在理论上的VM突破风险。

NVIDIA如何优化AI工作负载的GPU性能?

NVIDIA通过支持PCIe拓扑和设备映射,确保GPU在保密虚拟机中保持裸金属性能。

➡️

继续阅读