小红花·文摘

本文综述了强化学习在连续控制中的应用，特别是模型预测控制（MPC）与强化学习的结合。研究提出了多目标强化学习框架和基于信息理论的Q学习算法，验证了其在实际控制任务中的有效性，并提出了新的参数化控制器，以提高计算效率和性能保证，展示了在实际场景中的应用潜力。