优化鱼鳍控制下推力性能的异步并行强化学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一个基于深度强化学习的模块化框架,用于控制内陆水路上的自主表面船舶。框架包括高级本地路径规划和低级路径跟踪单元,每个单元都有一个DRL代理。代理在仿真环境中进行了验证。

🎯

关键要点

  • 提出了一个基于深度强化学习的模块化框架,用于控制内陆水路上的自主表面船舶。
  • 框架包括两个层次:高级本地路径规划单元和低级路径跟踪单元。
  • 每个单元都包含一个深度强化学习代理。
  • 高级本地路径规划代理负责考虑附近船只、交通规则和水路几何形状来规划路径。
  • 使用了空间时间循环神经网络架构,在连续行动空间下进行转移。
  • 低级路径跟踪代理负责低级执行器控制,考虑浅水影响和环境力量。
  • 两个代理在仿真环境中进行了全面验证,以德国北部的下艾尔伯为案例,使用真实的AIS轨迹模拟其他船只行为。
➡️

继续阅读