ASPLOS‘23 系统顶会论文 Plugsched :安全、高效的多场景调度器热升级详解

💡 原文中文,约6700字,阅读约需16分钟。
📝

内容提要

阿里云基础软件/达摩操作系统实验室的论文介绍了针对调度器的热升级系统 Plugsched,该项目已经开源。Plugsched 简化了调度器的开发和部署流程,支持组件级的热升级,而不需要内核修改代码以及额外的开销。实验结果表明热升级带来的停机时间只有 2.1∼2.6 ,回滚的停机时间为1.8∼2.5 。

🎯

关键要点

  • 阿里云达摩操作系统实验室的论文介绍了开源的调度器热升级系统Plugsched。
  • Plugsched简化了调度器的开发和部署流程,支持组件级热升级,无需修改内核代码。
  • 实验结果显示,Plugsched的热升级停机时间为2.1至2.6毫秒,回滚停机时间为1.8至2.5毫秒。
  • Linux调度器是操作系统的重要组成部分,支持多任务和高性能工作负载。
  • 现有的热升级技术无法支持内核调度子系统的热升级,Plugsched填补了这一空白。
  • Plugsched的两个关键创新点是调度器模块化和数据重建技术。
  • Plugsched支持在商用Linux服务器上进行热升级,具有高通用性和安全性。
  • Plugsched的设计包括预处理、开发和部署三个阶段,确保调度器的安全更新。
  • Plugsched已经在4000台服务器上部署,提供安全高效的热升级能力。
  • 与其他热升级工具相比,Plugsched在停机时间上表现更优,且可扩展到其他Linux子系统。
➡️

继续阅读