ASPLOS‘23 系统顶会论文 Plugsched :安全、高效的多场景调度器热升级详解
💡
原文中文,约6700字,阅读约需16分钟。
📝
内容提要
阿里云基础软件/达摩操作系统实验室的论文介绍了针对调度器的热升级系统 Plugsched,该项目已经开源。Plugsched 简化了调度器的开发和部署流程,支持组件级的热升级,而不需要内核修改代码以及额外的开销。实验结果表明热升级带来的停机时间只有 2.1∼2.6 ,回滚的停机时间为1.8∼2.5 。
🎯
关键要点
- 阿里云达摩操作系统实验室的论文介绍了开源的调度器热升级系统Plugsched。
- Plugsched简化了调度器的开发和部署流程,支持组件级热升级,无需修改内核代码。
- 实验结果显示,Plugsched的热升级停机时间为2.1至2.6毫秒,回滚停机时间为1.8至2.5毫秒。
- Linux调度器是操作系统的重要组成部分,支持多任务和高性能工作负载。
- 现有的热升级技术无法支持内核调度子系统的热升级,Plugsched填补了这一空白。
- Plugsched的两个关键创新点是调度器模块化和数据重建技术。
- Plugsched支持在商用Linux服务器上进行热升级,具有高通用性和安全性。
- Plugsched的设计包括预处理、开发和部署三个阶段,确保调度器的安全更新。
- Plugsched已经在4000台服务器上部署,提供安全高效的热升级能力。
- 与其他热升级工具相比,Plugsched在停机时间上表现更优,且可扩展到其他Linux子系统。
➡️