多智能体系统的自适应安全学习

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文提出了一种名为BLAC的强化学习框架,使用控制障碍函数和控制李雅普诺夫函数约束,维护系统的安全性和稳定性。仿真结果表明,该框架产生的控制器可以帮助系统接近期望状态,并导致更少的安全约束违反。

🎯

关键要点

  • 提出了一种名为BLAC的强化学习框架。
  • BLAC框架基于控制障碍函数和控制李雅普诺夫函数。
  • 该框架有助于维护系统的安全性和稳定性。
  • 使用重放缓冲器中的数据构建安全性和稳定性的约束。
  • 采用增广拉格朗日方法更新基于RL的控制器参数。
  • 引入备份控制器以应对约束无法同时满足的情况。
  • 仿真结果显示BLAC框架的控制器能更好地接近期望状态。
  • BLAC框架导致更少的安全约束违反。
➡️

继续阅读