陈少文的博客 ·

Kubernetes 下开源的 GPU 虚拟化项目

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

NVIDIA 的 k8s-device-plugin 和 gpu-operator 用于管理 Kubernetes 中的 GPU 资源，支持 MIG、Time-Slicing 和 MPS 等多种分配方式。MIG 可将 GPU 划分为独立实例，Time-Slicing 允许多个虚拟设备共享物理 GPU。gpu-manager 和 HAMi 通过 vCUDA 技术实现 GPU 资源的细粒度划分与共享。

🎯

关键要点

NVIDIA 的 k8s-device-plugin 和 gpu-operator 用于管理 Kubernetes 中的 GPU 资源。
k8s-device-plugin 自动发现和注册 GPU 设备，支持多种 GPU 型号。
gpu-operator 提供驱动管理、容器运行集成、设备发现等 GPU 全生命周期管理功能。
MIG 技术允许将 GPU 划分为多个独立实例，每个实例的计算、显存、带宽相互独立。
Time-Slicing 允许将物理 GPU 切分为多个虚拟设备，存在资源竞争问题。
MPS 技术允许多个进程共享同一物理 GPU，提高 GPU 利用率，提供更好的资源隔离。
gpu-manager 采用 vCUDA 技术实现 GPU 资源的细粒度划分与共享。
HAMi 也采用 vCUDA 技术，支持 MIG、Time-Slicing，并能管理其他 AI 加速卡。

❓

延伸问答

NVIDIA 的 k8s-device-plugin 有什么功能？

k8s-device-plugin 用于自动发现和注册 Kubernetes 中的 GPU 设备，并支持多种 GPU 型号的管理和分配。

什么是 MIG 技术，它如何在 Kubernetes 中使用？

MIG（Multi-Instance GPU）技术允许将一张 GPU 划分为多个独立实例，每个实例的计算、显存和带宽相互独立。在 Kubernetes 中使用时，需要配置相关的插件和资源限制。

Time-Slicing 技术的主要特点是什么？

Time-Slicing 允许将物理 GPU 切分为多个虚拟设备，多个 Pod 可以在时间上共享同一物理 GPU，但存在资源竞争问题。

MPS 技术如何提高 GPU 的利用率？

MPS（Multi-Process Service）允许多个进程共享同一物理 GPU 的计算资源，从而提高 GPU 的利用率，并提供更好的资源隔离。

gpu-manager 和 HAMi 有什么区别？

gpu-manager 采用 vCUDA 技术进行 GPU 资源的细粒度划分，但不再维护；而 HAMi 也使用 vCUDA，持续更新并支持更多 AI 加速卡的管理。

如何在 Kubernetes 中配置 Time-Slicing？

在 Kubernetes 中配置 Time-Slicing 需要创建一个 ConfigMap，定义资源名称和虚拟设备的数量，然后在 Pod 中使用相应的资源限制。

🏷️

继续阅读

Jim Bugwadia谈为何发现Kubernetes问题只是Kyverno用户战斗的一半
Kyverno项目在CNCF毕业，成为Kubernetes最受欢迎的开源策略引擎。其商业版Nirmata提供企业支持和管理功能。经过五年的发展，Kyver...
OpenAI的新GPT-5.5在NVIDIA基础设施上驱动Codex应用，NVIDIA已开始投入使用
OpenAI的最新模型GPT-5.5已在NVIDIA基础设施上运行，推动Codex应用程序的开发。超过10,000名NVIDIA员工在各个职能中使用Cod...
灯光、摄像、开源！
这篇文章讨论了Cult.Repo制作关于开源软件及其背后人物的纪录片。制片人Emma Tracey和Josiah Mcgarvie探讨了开源项目的吸引力，...
开源AI性价比之王DeepSeek v4发布：1.6T参数仅售3.48美元！
DeepSeek v4发布了Pro和Flash两个版本，分别拥有1.6T和284B参数，价格低至3.48美元和0.28美元。Pro版适合复杂任务，Flas...
从IDC到云上GPU：基于 Amazon EKS 的大模型推理混合云弹性部署实践
本文介绍了基于Amazon EKS和NVIDIA NIM的混合云大模型推理架构，强调本地GPU优先和云上弹性扩展的策略。通过KEDA和Karpenter实...
对话金铲铲项目团队：新赛季，我们做了个“违背祖宗”的决定
“首先，我们不会让「金铲铲」玩家无法获得金铲铲。”这是两周前的《金铲铲之战》新赛季媒体品鉴会上，项目团队对“新赛季获取金铲铲会变难吗”的回答。这款游戏在昨...