本文综述了强化学习在连续控制中的应用,特别是模型预测控制(MPC)与强化学习的结合。研究提出了多目标强化学习框架和基于信息理论的Q学习算法,验证了其在实际控制任务中的有效性,并提出了新的参数化控制器,以提高计算效率和性能保证,展示了在实际场景中的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。