CCE云原生混部场景下的测试案例

💡 原文中文,约5700字,阅读约需14分钟。
📝

内容提要

本文介绍了CCE云原生混部场景下在线任务抢占和离线任务压制的方法,提高资源利用率和服务质量。同时介绍了环境准备和演示步骤。

🎯

关键要点

  • 企业IT环境中有在线服务和离线作业两类进程。
  • 在线任务对时延敏感,服务SLA要求高,离线任务容错率高且时延不敏感。
  • 混部通过将在线和离线任务部署在同一节点,提高资源利用率。
  • 调度层面实现节点调度资源超分,CPU层面实现在线任务抢占和压制离线任务。
  • 环境要求包括集群版本、节点OS和Volcano插件版本。
  • 演示步骤包括创建工作负载、压测基线和观察指标。
  • 非混部场景下,redis性能数据在压力测试中急速退化。
  • 混部场景中,通过配置混部标签和驱逐阈值,保障在线任务服务质量。
  • 即使离线任务占用CPU,操作系统依然维持在线任务的CPU诉求。

延伸问答

什么是CCE云原生混部场景?

CCE云原生混部场景是将在线服务和离线作业部署在同一节点,以提高资源利用率和服务质量的环境。

在线任务和离线任务有什么区别?

在线任务对时延敏感,服务SLA要求高;离线任务容错率高且时延不敏感,通常允许重运行。

如何在混部场景中保障在线任务的服务质量?

通过配置混部标签和驱逐阈值,系统可以在资源使用时优先保障在线任务的CPU需求。

混部场景下的调度机制是怎样的?

调度层面实现节点调度资源超分,CPU层面实现在线任务抢占和压制离线任务。

在CCE环境中,如何准备混部场景的环境?

环境要求包括特定的集群版本、节点操作系统和Volcano插件版本。

如何进行混部场景的性能测试?

可以使用redis-benchmark命令对redis进行压测,并在grafana中观察指标和CPU使用率。

➡️

继续阅读