小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
基于 KEDA 的 Kubernetes GPU 自动扩展:构建外部扩展器

KEDA 通过自定义 DaemonSet 解决 Kubernetes 中 GPU 工作负载的自动扩展问题。它利用 NVIDIA 管理库 (NVML) 收集 GPU 指标,如利用率、内存和功耗,并通过 gRPC 提供给 KEDA 操作员,从而实现基于 GPU 性能的自动扩展。这种方法提高了资源利用率,降低了能耗,适用于多种 GPU 工作负载。

基于 KEDA 的 Kubernetes GPU 自动扩展:构建外部扩展器

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-05-27T11:00:00Z

NVIDIA的nvml库可监控GPU的功率、温度和利用率等统计信息。通过自定义C++应用程序,可以实现类似nvidia-smi dmon的功能,获取详细的GPU性能指标。

NVIDIA NVML GPU统计信息

Lei Mao's Log Book
Lei Mao's Log Book · 2025-12-25T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码