可持续数据中心控制基准测试工具SustainDC

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文探索使用强化学习设计云计算节点上的功耗限制策略,通过将软件堆栈与硬件控制机制相结合,设计一个代理程序来控制处理器的最大供电功率,而不会影响应用性能。利用PPO代理程序在计算节点的数学模型上学习最优策略,通过平衡功耗和应用性能来采取行动。

🎯

关键要点

  • Exascale计算将导致云数据中心计算节点能源需求增长。

  • 降低硬件组件功耗是减少能源需求的常见方法。

  • 设计实时检测和限制功耗的资源控制器是复杂的,可能影响应用性能。

  • 本文探索使用强化学习设计云计算节点上的功耗限制策略。

  • 结合Argo Node Resource Management软件堆栈与Intel RAPL硬件控制机制,设计代理程序控制处理器最大供电功率。

  • 使用Proximal Policy Optimization代理程序在计算节点的数学模型上学习最优策略。

  • 通过STREAM基准测试评估经过训练的代理程序在实际硬件上的表现,平衡功耗和应用性能。

➡️

继续阅读