CCE云原生混部场景下的测试案例
💡
原文中文,约5700字,阅读约需14分钟。
📝
内容提要
本文介绍了CCE云原生混部场景下在线任务抢占和离线任务压制的方法,提高资源利用率和服务质量。同时介绍了环境准备和演示步骤。
🎯
关键要点
- 企业IT环境中有在线服务和离线作业两类进程。
- 在线任务对时延敏感,服务SLA要求高,离线任务容错率高且时延不敏感。
- 混部通过将在线和离线任务部署在同一节点,提高资源利用率。
- 调度层面实现节点调度资源超分,CPU层面实现在线任务抢占和压制离线任务。
- 环境要求包括集群版本、节点OS和Volcano插件版本。
- 演示步骤包括创建工作负载、压测基线和观察指标。
- 非混部场景下,redis性能数据在压力测试中急速退化。
- 混部场景中,通过配置混部标签和驱逐阈值,保障在线任务服务质量。
- 即使离线任务占用CPU,操作系统依然维持在线任务的CPU诉求。
➡️