本文探讨了在线线性二次调节器(LQR)控制在动态干扰下的应用,提出了一种新的自适应控制算法,解决了未知线性系统和需求预测问题。研究表明,该算法在多种非线性控制任务中表现良好,并通过新策略降低了遗憾界限,确保了控制性能。
本文提出了一种结合强化学习与控制屏障函数的控制器架构,旨在确保系统的安全性和稳定性。通过高斯过程建模系统动态,利用自监督学习框架和控制李雅普诺夫函数来优化控制器参数。实验结果表明,该方法在非线性控制系统中有效降低模型不确定性,提升安全性和性能。
完成下面两步后,将自动完成登录并继续当前操作。