研究人员提出了一种名为FCSRL的新框架,用于在安全强化学习中增强策略学习和约束估计。实证评估表明,该方法在多种任务中能够学习到更好的安全感知嵌入并取得优越的性能。
完成下面两步后,将自动完成登录并继续当前操作。