小红花·文摘

研究人员提出了一种名为FCSRL的新框架，用于在安全强化学习中增强策略学习和约束估计。实证评估表明，该方法在多种任务中能够学习到更好的安全感知嵌入并取得优越的性能。