本文提出了一种名为BLAC的强化学习框架,使用控制障碍函数和控制李雅普诺夫函数约束,维护系统的安全性和稳定性。仿真结果表明,该框架产生的控制器可以帮助系统接近期望状态,并导致更少的安全约束违反。
完成下面两步后,将自动完成登录并继续当前操作。