The New Stack ·

Kubernetes：充分利用动态资源分配

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

随着数据中心电力和硬件成本上升，组织们在Kubernetes上运行AI项目时寻求提高效率。Cloud Native Computing Foundation推出了Kubernetes调度器的增强功能DRA，允许用户更精确地分配资源，通过新的API提供设备属性，优化资源调度，提升GPU和CPU集群的性能。

🎯

关键要点

数据中心电力和硬件成本上升，组织寻求提高Kubernetes上AI项目的效率。
Cloud Native Computing Foundation推出Kubernetes调度器增强功能DRA，允许更精确地分配资源。
DRA通过新的API提供设备属性，优化资源调度，提升GPU和CPU集群性能。
DRA是设备插件的丰富替代品，提供设备的详细属性信息。
用户可以提交ResourceClaim，指定作业所需的组件，调度器根据请求匹配可用设备。
DRA有助于解决资源调度中的不对齐问题，提升AI/ML作业的性能。
DRA支持用户指定设备的本地性，进行本地感知调度。
资源对齐对多个工作负载（如LLM推理和训练）有显著好处。
DRA的核心组件已准备就绪，未来将扩展更多资源控制能力。

❓

延伸问答

DRA在Kubernetes中有什么作用？

DRA允许用户更精确地分配资源，优化调度，提高AI项目的性能。

DRA如何解决资源调度中的不对齐问题？

DRA通过允许用户指定设备的本地性，进行本地感知调度，从而解决不对齐问题。

使用DRA时，用户如何提交资源请求？

用户可以提交ResourceClaim，指定作业所需的组件，调度器根据请求匹配可用设备。

DRA对AI/ML作业的性能有什么影响？

DRA有助于提升AI/ML作业的性能，解决资源调度中的不对齐问题。

DRA与传统设备插件有什么不同？

DRA提供设备的详细属性信息，而传统插件仅能提供设备数量。

DRA的未来发展方向是什么？

DRA计划扩展更多资源控制能力，包括硬件拓扑的扩展。

🏷️

继续阅读

网易游戏如何在Kubernetes上实现30秒的LLM冷启动
在网易游戏，我们发现大语言模型（LLM）推理的关键在于数据传输速度。通过使用Fluid，我们将模型加载时间从42分钟缩短至3分钟，显著提高了推理效率。同时...
如何使用cert-manager、Let's Encrypt和内部TLS加密Kubernetes流量
Kubernetes集群默认不加密Pod间流量和Ingress流量。使用cert-manager可以自动管理证书的申请和更新，简化TLS配置，确保Ingr...
NAS系统Unraid 7.3.0正式版发布用户终于可以不再使用U盘启动系统
Unraid v7.3.0 版发布，首次支持硬盘启动，解决了 U 盘性能和可靠性问题。用户可从 NVMe SSD、SATA SSD 等内部驱动器启动，提升...
维基: Vibe 编程
“Vibe coding”是一种无需编程知识即可通过提示大型语言模型（LLM）构建软件的方法。尽管便捷，但生成的软件常存在可维护性、正确性和安全性问题，适...
How Platform Engineering Using Golden Bricks Can Enable Fast and Smooth Delivery
Platform engineering should have a product focus, as developers are customers...
AI 分身 24 小时冲浪，它交朋友怎么比我还好？
《黑镜》第二季探讨了AI社交的未来，AI分身技术正在发展，用户可通过AI代理在社交平台上互动，打破时间和语言障碍。产品如SparkRizz允许用户创建个性...