小红花·文摘

本文介绍了多个安全强化学习框架和算法，如CBFIRL、可行策略迭代算法和FCSRL，旨在提升学习过程的安全性和稳定性。通过引入控制障碍函数等技术，这些方法在不同任务中表现出更好的安全性和性能，实验结果显示安全性提高了15%至50%。