使用 Prometheus 在 KubeSphere 上监控 KubeEdge 边缘节点(Jetson) CPU、GPU 状态
💡
原文中文,约21100字,阅读约需51分钟。
📝
内容提要
本文介绍了在KubeSphere中实现边缘节点的可观测性的方法,包括使用KubeSphere和KubeEdge构建云边一体化计算平台,通过Prometheus监控Nvidia Jetson边缘设备的状态,以及展示GPU信息在KubeSphere前端界面上。
🎯
关键要点
- KubeSphere通过KubeEdge实现边缘节点的统一管理和监控。
- KubeSphere 1.23.x版本支持边缘计算,但缺乏边缘节点资源监控信息。
- 使用Prometheus监控Nvidia Jetson边缘设备的状态,提升可观测性。
- 部署K8s环境时可使用KubeKey快速创建集群。
- KubeEdge环境需开启边缘节点日志查询功能以便于问题定位。
- 修改KubeSphere配置以支持边缘节点插件,并确保node-exporter在边缘节点上运行。
- 通过修改node-exporter的亲和性设置,使其能够在边缘节点上部署。
- 解决KubeEdge边缘节点pod环境变量缺失问题,确保kube-rbac-proxy容器正常启动。
- 安装EdgeMesh以便于边缘pod访问Kubernetes服务。
- 配置edgecore以支持DNS和metaServer功能,确保服务正常运行。
- 安装Jtop以监控Jetson GPU状态,并开发Jetson GPU Exporter。
- 创建KubeSphere资源以将Jetson Exporter采集的数据提供给Prometheus。
- 通过修改KubeSphere前端代码,展示GPU监控数据。
- 成功实现KubeSphere对KubeEdge边缘节点的CPU、内存和GPU状态的监控。
🏷️
标签
➡️