多智能体系统的自适应安全学习
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文提出了一种名为BLAC的强化学习框架,使用控制障碍函数和控制李雅普诺夫函数约束,维护系统的安全性和稳定性。仿真结果表明,该框架产生的控制器可以帮助系统接近期望状态,并导致更少的安全约束违反。
🎯
关键要点
- 提出了一种名为BLAC的强化学习框架。
- BLAC框架基于控制障碍函数和控制李雅普诺夫函数。
- 该框架有助于维护系统的安全性和稳定性。
- 使用重放缓冲器中的数据构建安全性和稳定性的约束。
- 采用增广拉格朗日方法更新基于RL的控制器参数。
- 引入备份控制器以应对约束无法同时满足的情况。
- 仿真结果显示BLAC框架的控制器能更好地接近期望状态。
- BLAC框架导致更少的安全约束违反。
➡️