💡
原文英文,约1100词,阅读约需4分钟。
📝
内容提要
在2025年OpenInfra峰会上,NVIDIA强调AI开发者应结合Kata Containers和保密计算,以安全地在GPU上运行敏感工作负载。Kata提供轻量级虚拟机隔离,保密计算确保内存数据加密,防止云服务商访问模型和数据。NVIDIA致力于平衡GPU性能与安全性,支持PCIe拓扑和设备映射,以优化AI工作负载。
🎯
关键要点
- 在2025年OpenInfra峰会上,NVIDIA强调AI开发者需要结合Kata Containers和保密计算,以安全地在GPU上运行敏感工作负载。
- Kata Containers是一个开源项目,结合轻量级虚拟机和容器运行时,提供强隔离性。
- 保密计算提供内存数据和应用程序加密,确保云服务商无法访问模型和数据。
- NVIDIA致力于在GPU性能与安全性之间取得平衡,支持PCIe拓扑和设备映射以优化AI工作负载。
- NVIDIA的虚拟化参考架构(VRA)解决了PCIe拓扑和GPU间通信的问题,支持两种方法:扁平化层次和主机拓扑复制。
- NVIDIA与Red Hat、IBM及开源Kata社区合作,推动VRA及工具的上游开发。
- 结合Kata和保密计算并非万无一失,仍存在理论上的VM突破风险,但显著降低了云服务商访问敏感数据的机会。
- NVIDIA的方案将推动新的AI堆栈,结合轻量级VM隔离、硬件内存加密和GPU设备映射抽象。
❓
延伸问答
NVIDIA在2025年OpenInfra峰会上提出了什么关键建议?
NVIDIA建议AI开发者结合Kata Containers和保密计算,以安全地在GPU上运行敏感工作负载。
Kata Containers的主要功能是什么?
Kata Containers结合轻量级虚拟机和容器运行时,提供强隔离性和性能优势。
保密计算如何增强数据安全性?
保密计算通过内存数据和应用程序加密,确保云服务商无法访问模型和数据。
NVIDIA的虚拟化参考架构(VRA)解决了什么问题?
VRA解决了PCIe拓扑和GPU间通信的问题,支持不同的拓扑方法。
结合Kata和保密计算的风险是什么?
尽管降低了云服务商访问敏感数据的机会,但仍存在理论上的VM突破风险。
NVIDIA如何优化AI工作负载的GPU性能?
NVIDIA通过支持PCIe拓扑和设备映射,确保GPU在保密虚拟机中保持裸金属性能。
➡️