小红花·文摘

本文提出了一种新的参数化控制器，通过学习问题参数而不是从模型中导出，解决了深度强化学习中学习控制器的局限性。学习到的控制器具有可验证特性，并在控制性能上与其他控制器相当。通过车辆漂移操纵任务的实际应用，展示了该控制器的潜力。