可持续数据中心控制基准测试工具SustainDC
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文探索使用强化学习设计云计算节点上的功耗限制策略,通过将软件堆栈与硬件控制机制相结合,设计一个代理程序来控制处理器的最大供电功率,而不会影响应用性能。利用PPO代理程序在计算节点的数学模型上学习最优策略,通过平衡功耗和应用性能来采取行动。
🎯
关键要点
-
Exascale计算将导致云数据中心计算节点能源需求增长。
-
降低硬件组件功耗是减少能源需求的常见方法。
-
设计实时检测和限制功耗的资源控制器是复杂的,可能影响应用性能。
-
本文探索使用强化学习设计云计算节点上的功耗限制策略。
-
结合Argo Node Resource Management软件堆栈与Intel RAPL硬件控制机制,设计代理程序控制处理器最大供电功率。
-
使用Proximal Policy Optimization代理程序在计算节点的数学模型上学习最优策略。
-
通过STREAM基准测试评估经过训练的代理程序在实际硬件上的表现,平衡功耗和应用性能。
🏷️
标签
➡️