高效的离线安全强化学习:使用信任区域条件风险 本论文提出了一种基于风险约束的安全强化学习方法,并通过引入适应性信任区约束以减少分布偏移的影响,解决了在复杂环境中实现优异性能并快速满足安全约束的问题。 安全