谨防不确定性:风险意识和积极探索模型的基于强化学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文介绍了一种基于模型的强化学习中的风险管理方法,使用概率安全约束、乐观和悲观以及随机神经网络的平衡来处理不确定性。实验证明,该方法在数据驱动的 MPC 方法中表现良好。

🎯

关键要点

  • 介绍了一种基于模型的强化学习中的风险管理方法。
  • 该方法使用概率安全约束来处理不确定性。
  • 在确知不确定性面前采取乐观态度,在事件性不确定性面前采取悲观态度。
  • 使用一组随机神经网络的平衡来应对不确定性。
  • 实验证明该方法在数据驱动的MPC方法中表现良好。
  • 不确定性的分离对于安全关键的控制环境至关重要。
➡️

继续阅读