BriefGPT - AI 论文速递 ·

基于强化学习的自适应控制屏障函数的滑动时限控制在安全关键系统中的应用

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文提出了一种结合强化学习与控制屏障函数的控制器架构，旨在确保系统的安全性和稳定性。通过高斯过程建模系统动态，利用自监督学习框架和控制李雅普诺夫函数来优化控制器参数。实验结果表明，该方法在非线性控制系统中有效降低模型不确定性，提升安全性和性能。

🎯

❓

控制屏障函数用于确保系统在学习过程中的安全性，结合强化学习控制器和模型控制器来处理不确定性。

高斯过程用于建模系统动态，并进行不确定性分析，以优化控制器的性能。

自监督学习框架通过建立连续可微函数来优化控制器参数，从而增强安全性和稳定性。

实验结果显示，该方法在非线性控制系统中有效降低模型不确定性，提升安全性和性能。

研究提出了一种结合强化学习与控制屏障函数的控制器架构，以确保系统的安全性和稳定性。

引入备份控制器，以防RL控制器无法同时满足安全和稳定性约束时提供有效控制信号。

🏷️