CCE云原生混部场景下的测试案例
💡
原文中文,约5700字,阅读约需14分钟。
📝
内容提要
本文介绍了CCE云原生混部场景下在线任务抢占和离线任务压制的方法,提高资源利用率和服务质量。同时介绍了环境准备和演示步骤。
🎯
关键要点
- 企业IT环境中有在线服务和离线作业两类进程。
- 在线任务对时延敏感,服务SLA要求高,离线任务容错率高且时延不敏感。
- 混部通过将在线和离线任务部署在同一节点,提高资源利用率。
- 调度层面实现节点调度资源超分,CPU层面实现在线任务抢占和压制离线任务。
- 环境要求包括集群版本、节点OS和Volcano插件版本。
- 演示步骤包括创建工作负载、压测基线和观察指标。
- 非混部场景下,redis性能数据在压力测试中急速退化。
- 混部场景中,通过配置混部标签和驱逐阈值,保障在线任务服务质量。
- 即使离线任务占用CPU,操作系统依然维持在线任务的CPU诉求。
❓
延伸问答
什么是CCE云原生混部场景?
CCE云原生混部场景是将在线服务和离线作业部署在同一节点,以提高资源利用率和服务质量的环境。
在线任务和离线任务有什么区别?
在线任务对时延敏感,服务SLA要求高;离线任务容错率高且时延不敏感,通常允许重运行。
如何在混部场景中保障在线任务的服务质量?
通过配置混部标签和驱逐阈值,系统可以在资源使用时优先保障在线任务的CPU需求。
混部场景下的调度机制是怎样的?
调度层面实现节点调度资源超分,CPU层面实现在线任务抢占和压制离线任务。
在CCE环境中,如何准备混部场景的环境?
环境要求包括特定的集群版本、节点操作系统和Volcano插件版本。
如何进行混部场景的性能测试?
可以使用redis-benchmark命令对redis进行压测,并在grafana中观察指标和CPU使用率。
➡️