深度强化学习用于多目标优化:提升风力发电同时减少噪声排放

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

加拿大阿尔伯塔省的研究发现,将西门子公司的热力学软件纳入环境模型,并模拟不确定性,发现深度 Q 网络(DQN)是处理经济型燃气轮机调度问题最有效的算法,近端策略优化(PPO)是最高效的方法。研究还提出了一种动态分配燃气轮机运行和维护成本的方法,更好地近似了现代燃气轮机调度的真实成本。

🎯

关键要点

  • 加拿大阿尔伯塔省的研究将西门子公司的热力学软件纳入环境模型。
  • 研究模拟了电力价格、负载和环境条件的变化的不确定性。
  • 实施了三种深度强化学习算法来处理经济型燃气轮机调度问题。
  • 深度 Q 网络(DQN)获得了最高的奖励。
  • 近端策略优化(PPO)被认为是最高效的方法。
  • 提出了一种动态分配燃气轮机运行和维护成本的方法。
  • 新方法更好地近似了现代燃气轮机调度的真实成本,导致更现实的策略。
➡️

继续阅读