The New Stack ·

如何在保密虚拟机中获得裸金属GPU性能

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

在2025年OpenInfra峰会上，NVIDIA强调AI开发者应结合Kata Containers和保密计算，以安全地在GPU上运行敏感工作负载。Kata提供轻量级虚拟机隔离，保密计算确保内存数据加密，防止云服务商访问模型和数据。NVIDIA致力于平衡GPU性能与安全性，支持PCIe拓扑和设备映射，以优化AI工作负载。

🎯

关键要点

在2025年OpenInfra峰会上，NVIDIA强调AI开发者需要结合Kata Containers和保密计算，以安全地在GPU上运行敏感工作负载。
Kata Containers是一个开源项目，结合轻量级虚拟机和容器运行时，提供强隔离性。
保密计算提供内存数据和应用程序加密，确保云服务商无法访问模型和数据。
NVIDIA致力于在GPU性能与安全性之间取得平衡，支持PCIe拓扑和设备映射以优化AI工作负载。
NVIDIA的虚拟化参考架构（VRA）解决了PCIe拓扑和GPU间通信的问题，支持两种方法：扁平化层次和主机拓扑复制。
NVIDIA与Red Hat、IBM及开源Kata社区合作，推动VRA及工具的上游开发。
结合Kata和保密计算并非万无一失，仍存在理论上的VM突破风险，但显著降低了云服务商访问敏感数据的机会。
NVIDIA的方案将推动新的AI堆栈，结合轻量级VM隔离、硬件内存加密和GPU设备映射抽象。

🔎

延伸解读

Kata Containers与保密计算的结合

Kata Containers与保密计算的结合为AI开发者提供了在云环境中安全运行敏感工作负载的可能性。Kata Containers通过轻量级虚拟机提供强隔离性，而保密计算则确保内存数据加密，防止云服务商访问。这种组合虽然降低了数据泄露的风险，但仍需注意理论上的虚拟机突破风险。

PCIe拓扑与GPU性能优化

NVIDIA的虚拟化参考架构（VRA）解决了PCIe拓扑和GPU间通信的问题，支持两种不同的拓扑处理方式。开发者在选择时需考虑应用场景，扁平化拓扑适合简化配置，而主机拓扑复制则能保留更复杂的GPU通信能力。合理的拓扑选择对性能优化至关重要。

开源合作的重要性

NVIDIA与Red Hat、IBM及Kata社区的合作，推动了虚拟化参考架构的上游开发。这种开源合作不仅促进了技术的共享与创新，也为开发者提供了可复制的参考架构，帮助他们在实际应用中更好地实现安全与性能的平衡。

❓

延伸问答

NVIDIA在2025年OpenInfra峰会上提出了什么关键建议？

NVIDIA建议AI开发者结合Kata Containers和保密计算，以安全地在GPU上运行敏感工作负载。

Kata Containers的主要功能是什么？

Kata Containers结合轻量级虚拟机和容器运行时，提供强隔离性和性能优势。

保密计算如何增强数据安全性？

保密计算通过内存数据和应用程序加密，确保云服务商无法访问模型和数据。

NVIDIA的虚拟化参考架构（VRA）解决了什么问题？

VRA解决了PCIe拓扑和GPU间通信的问题，支持不同的拓扑方法。

结合Kata和保密计算的风险是什么？

尽管降低了云服务商访问敏感数据的机会，但仍存在理论上的VM突破风险。

NVIDIA如何优化AI工作负载的GPU性能？

NVIDIA通过支持PCIe拓扑和设备映射，确保GPU在保密虚拟机中保持裸金属性能。

🏷️