如何给 Kubernetes 应用设置 HPA 以及相关参数
💡
原文中文,约6600字,阅读约需16分钟。
📝
内容提要
中大型企业采用混合云方案,将应用部署在公有云和私有云。Kubernetes适配混合云场景,调度均衡和HPA扩缩容需考虑资源请求量。配置HPA时,设置副本数量上下限和CPU使用率。
🎯
关键要点
- 中大型企业采用混合云方案,部分应用部署在公有云,部分部署在私有云。
- Kubernetes适配混合云场景,调度均衡和HPA扩缩容需考虑资源请求量。
- Request是资源请求量,保障应用分配足够资源,Limit用于保护其他应用。
- HPA依赖于Request值进行扩缩容,计算资源使用率时需考虑多个Pod的资源消耗。
- 设置Request时应满足应用基本使用,避免资源浪费,CPU和内存的设置方法不同。
- Limit设置用于保护其他应用,避免资源消耗过高影响其他应用的正常运行。
- 调试前需关注业务SLO告警,确保服务的稳定性。
- 应用分级可根据QoS类型决定驱逐策略,重点应用应设置相等的Request和Limit。
- 开启Pod调度的亲和性以优化资源分配,避免节点过载。
- 创建HPA对象时需指定Deployment名称及相关参数,设置副本数量上下限和CPU使用率。
- 调试HPA前应配置告警,保障服务的SLA,设置Request、Limit及HPA参数是繁琐的过程。
- 通过优化HPA相关参数,降低公有云成本,考虑将长期占用的弹性公有云机器转移到私有云。
🏷️
标签
➡️