学习增强的高相对阶系统的安全控制:在干扰和故障下的鲁棒优化

📝

内容提要

本研究解决了在学习型控制问题中,如何平衡安全性与性能之间的挑战,尤其是在高相对阶状态约束和未知时变干扰/作动器故障的非线性系统中。论文提出了一种新的高阶互惠控制屏障函数(HO-RCBF),并引入梯度相似性的概念,用于量化安全性和性能之间的关系,最终在安全强化学习框架中实现了性能提高与安全保障的双赢。

➡️

继续阅读