谨防不确定性:风险意识和积极探索模型的基于强化学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了一种基于模型的强化学习中的风险管理方法,使用概率安全约束、乐观和悲观以及随机神经网络的平衡来处理不确定性。实验证明,该方法在数据驱动的 MPC 方法中表现良好。
🎯
关键要点
- 介绍了一种基于模型的强化学习中的风险管理方法。
- 该方法使用概率安全约束来处理不确定性。
- 在确知不确定性面前采取乐观态度,在事件性不确定性面前采取悲观态度。
- 使用一组随机神经网络的平衡来应对不确定性。
- 实验证明该方法在数据驱动的MPC方法中表现良好。
- 不确定性的分离对于安全关键的控制环境至关重要。
➡️