小红花·文摘

本文介绍了多个安全强化学习框架和算法，如CBFIRL、可行策略迭代算法和FCSRL，旨在提升学习过程的安全性和稳定性。通过引入控制障碍函数等技术，这些方法在不同任务中表现出更好的安全性和性能，实验结果显示安全性提高了15%至50%。

BriefGPT - AI 论文速递 ·

本文提出了一种名为BLAC的强化学习框架，使用控制障碍函数和控制李雅普诺夫函数约束，维护系统的安全性和稳定性。仿真结果表明，该框架产生的控制器可以帮助系统接近期望状态，并导致更少的安全约束违反。

BriefGPT - AI 论文速递 ·