基于神经算子的强化学习控制空间变延迟的一阶偏微分方程

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新方法,将偏微分方程的反向反馈控制与深度强化学习相结合,采用软演员-评论家架构和深度操作网络,模拟结果表明该算法优于传统控制器。

🎯

关键要点

  • 本研究提出了一种新方法,将偏微分方程的反向反馈控制与深度强化学习相结合。
  • 该方法采用软演员-评论家(SAC)架构和深度操作网络(DeepONet)。
  • 研究解决了由空间变量引起的延迟对分布参数系统控制的挑战。
  • 模拟结果表明该算法性能优于没有反向反馈知识的基线SAC及传统控制器。
➡️

继续阅读