使用 Prometheus 在 KubeSphere 上监控 KubeEdge 边缘节点(Jetson) CPU、GPU 状态

💡 原文中文,约21100字,阅读约需51分钟。
📝

内容提要

本文介绍了在KubeSphere中实现边缘节点的可观测性的方法,包括使用KubeSphere和KubeEdge构建云边一体化计算平台,通过Prometheus监控Nvidia Jetson边缘设备的状态,以及展示GPU信息在KubeSphere前端界面上。

🎯

关键要点

  • KubeSphere通过KubeEdge实现边缘节点的统一管理和监控。
  • KubeSphere 1.23.x版本支持边缘计算,但缺乏边缘节点资源监控信息。
  • 使用Prometheus监控Nvidia Jetson边缘设备的状态,提升可观测性。
  • 部署K8s环境时可使用KubeKey快速创建集群。
  • KubeEdge环境需开启边缘节点日志查询功能以便于问题定位。
  • 修改KubeSphere配置以支持边缘节点插件,并确保node-exporter在边缘节点上运行。
  • 通过修改node-exporter的亲和性设置,使其能够在边缘节点上部署。
  • 解决KubeEdge边缘节点pod环境变量缺失问题,确保kube-rbac-proxy容器正常启动。
  • 安装EdgeMesh以便于边缘pod访问Kubernetes服务。
  • 配置edgecore以支持DNS和metaServer功能,确保服务正常运行。
  • 安装Jtop以监控Jetson GPU状态,并开发Jetson GPU Exporter。
  • 创建KubeSphere资源以将Jetson Exporter采集的数据提供给Prometheus。
  • 通过修改KubeSphere前端代码,展示GPU监控数据。
  • 成功实现KubeSphere对KubeEdge边缘节点的CPU、内存和GPU状态的监控。
➡️

继续阅读