将强化学习与模型预测控制相结合及其在微电网中的应用
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对混合逻辑动态系统中的有限时间最优控制问题,提出了一种将强化学习与模型预测控制(MPC)相结合的方法,旨在减轻决策变量维度诅咒带来的挑战。通过有效解耦离散和连续变量的决策,以及采用解耦的Q函数,使学习问题更易处理,从而显著降低了MPC控制器的在线优化时间,实验证明该方法在微电网应用中显著提高了计算效率和政策的可行性。
本文介绍了一种端到端的强化学习方法,用于非线性模型预测控制的最优性能。通过两个应用验证了该方法的有效性,并与其他控制器进行了比较。结果显示,该方法在性能上相当,并在系统识别模型上表现更好。此外,该方法还展示了在控制设定变化时无需重新训练的优势。