增强强化学习中的安全性,通过异常状态序列建模
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究提出了一种利用异常状态序列增强强化学习安全性的新方法。通过训练代理收集安全状态序列并建立异常检测模型,有效监督训练具有安全意识的强化学习代理。
🎯
关键要点
- 在变化环境中,确保人工智能的安全性和可靠性是必要的。
- 本研究提出了一种新颖的安全强化学习方法,利用异常状态序列增强安全性。
- 通过在离线的‘源’环境中训练代理收集安全状态序列。
- 建立异常检测模型以检测在‘目标’环境中潜在不安全的状态序列。
- 利用异常检测模型估计的风险来训练风险规避的强化学习策略。
- 通过调整奖励函数惩罚代理访问被认定为不安全的异常状态。
- 在多个安全关键基准环境中(如自动驾驶汽车)成功学习到更安全的策略。
- 序列异常检测为训练具有安全意识的强化学习代理提供有效的监督信号。
➡️