The New Stack ·

NVIDIA开源KAI调度器，助力AI团队优化GPU利用率

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

在KubeCon欧洲大会上，NVIDIA宣布开源KAI调度器，这是一个专注于GPU的Kubernetes调度器，旨在优化AI和机器学习工作负载的GPU资源分配。KAI调度器支持动态配额调整和多种调度策略，如GPU共享，允许多个Pod共享同一GPU。与NVIDIA的GPU Operator不同，KAI调度器更具供应商中立性，并支持CPU上的AI工作负载。

🎯

关键要点

NVIDIA在KubeCon欧洲大会上宣布开源KAI调度器，专注于GPU的Kubernetes调度器。
KAI调度器旨在优化AI和机器学习工作负载的GPU资源分配，支持动态配额调整和多种调度策略。
KAI调度器允许多个Pod共享同一GPU，提供GPU共享功能。
与NVIDIA的GPU Operator不同，KAI调度器更具供应商中立性，支持CPU上的AI工作负载。
KAI调度器关注单个GPU及其可用内存，允许开发者保留内存份额，但不提供内存隔离。
KAI调度器默认与流行的AI工具和云原生框架集成，如Kubeflow的Training Operator、Ray和Argo。
KAI调度器的代码和文档现已在GitHub上发布，Run:ai的其他部分也已开源。

❓

延伸问答

KAI调度器的主要功能是什么？

KAI调度器旨在优化AI和机器学习工作负载的GPU资源分配，支持动态配额调整和多种调度策略。

KAI调度器与NVIDIA的GPU Operator有什么区别？

KAI调度器更具供应商中立性，支持CPU上的AI工作负载，而GPU Operator主要针对NVIDIA硬件和大型集群。

KAI调度器如何支持GPU共享？

KAI调度器允许多个Pod共享同一GPU，从而提高GPU的利用率。

KAI调度器的开源信息是什么？

KAI调度器的代码和文档已在GitHub上发布，采用Apache 2.0许可证。

KAI调度器支持哪些调度策略？

KAI调度器支持多种调度策略，包括群组调度、层次排队、装箱、分散和GPU共享。

KAI调度器如何处理内存分配？

KAI调度器关注单个GPU及其可用内存，允许开发者保留内存份额，但不提供内存隔离。

🏷️

继续阅读

NVIDIA及其合作伙伴在2026汉诺威博览会上展示AI驱动的制造未来
在2026汉诺威博览会上，NVIDIA及其合作伙伴展示了AI驱动的制造未来。随着工业系统复杂性增加，AI物理学和智能代理正在变革设计与测试。数字双胞胎和A...
Canva首席执行官谈公司向AI企业软件的重大转型
Canva首席执行官梅拉妮·珀金斯表示，公司将从“带有AI工具的设计平台”转型为“以AI为核心的设计平台”。新功能允许用户通过简单指令生成可编辑的演示文稿...
告别 kubectl 黑框，开源一个基于 Wails 打造 K8S 多集群管理工具
Kite-Desktop 是一款基于 Wails v3 的桌面 Kubernetes 多集群管理工具，旨在提升运维人员的管理体验。它支持快速切换集群、资源...
在Percona Operator for MySQL (PXC)中部署跨站点复制
本文讨论了在复杂的Kubernetes环境中配置Percona XtraDB Cluster (PXC)的跨站点复制以实现灾难恢复（DR）。首先，设置三节...
大规模自主AI：Adobe代理与NVIDIA和WPP解锁突破性的创意智能
Adobe与NVIDIA和WPP合作，推动自主AI在创意营销中的应用。品牌通过智能系统快速生成个性化内容，提升客户体验。NVIDIA的OpenShell运...
从公共静态主方法到黄金Kubestronaut：反学习的艺术
文章讲述了从传统Java开发者转变为云原生架构师的过程，强调可靠性是设计特性，需适应Kubernetes环境的变化。开发者应打破单体架构思维，转向微服务和...