该论文提出了一种鲁棒安全强化学习框架,旨在解决真实控制任务中的安全性问题。通过构建鲁棒不变集合和约束强化学习算法,优化策略并提高学习效率。研究表明,该框架在多种机器人环境中显著减少安全违规,表现出优越性。
完成下面两步后,将自动完成登录并继续当前操作。