优化鱼鳍控制下推力性能的异步并行强化学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一个基于深度强化学习的模块化框架,用于控制内陆水路上的自主表面船舶。框架包括高级本地路径规划和低级路径跟踪单元,每个单元都有一个DRL代理。代理在仿真环境中进行了验证。
🎯
关键要点
- 提出了一个基于深度强化学习的模块化框架,用于控制内陆水路上的自主表面船舶。
- 框架包括两个层次:高级本地路径规划单元和低级路径跟踪单元。
- 每个单元都包含一个深度强化学习代理。
- 高级本地路径规划代理负责考虑附近船只、交通规则和水路几何形状来规划路径。
- 使用了空间时间循环神经网络架构,在连续行动空间下进行转移。
- 低级路径跟踪代理负责低级执行器控制,考虑浅水影响和环境力量。
- 两个代理在仿真环境中进行了全面验证,以德国北部的下艾尔伯为案例,使用真实的AIS轨迹模拟其他船只行为。
➡️