本文提出了一种新的参数化控制器,通过学习问题参数而不是从模型中导出,解决了深度强化学习中学习控制器的局限性。学习到的控制器具有可验证特性,并在控制性能上与其他控制器相当。通过车辆漂移操纵任务的实际应用,展示了该控制器的潜力。
完成下面两步后,将自动完成登录并继续当前操作。