基于神经算子的强化学习控制空间变延迟的一阶偏微分方程
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法,将偏微分方程的反向反馈控制与深度强化学习相结合,采用软演员-评论家架构和深度操作网络,模拟结果表明该算法优于传统控制器。
🎯
关键要点
- 本研究提出了一种新方法,将偏微分方程的反向反馈控制与深度强化学习相结合。
- 该方法采用软演员-评论家(SAC)架构和深度操作网络(DeepONet)。
- 研究解决了由空间变量引起的延迟对分布参数系统控制的挑战。
- 模拟结果表明该算法性能优于没有反向反馈知识的基线SAC及传统控制器。
➡️