鲁棒确定性策略梯度用于干扰抑制及其在四旋翼控制中的应用

📝

内容提要

本研究解决了实际控制系统中由于模型不确定性和外部干扰而导致的最优控制策略识别困难。提出的鲁棒确定性策略梯度(RDPG)算法将$H_\infty$控制问题建模为一个二人零和动态博弈,通过深度强化学习实现了有效的干扰抑制。实验表明,该方法在干扰环境中具有优越的鲁棒性,能够在严重干扰条件下精确实时地跟踪移动目标。

➡️

继续阅读