本文研究了一种使用违规指标来惩罚不安全状态的方法,并在机器人地图导航任务中进行了实验。结果显示,使用违规指标的策略在性能上表现更好,能够减少访问不安全状态的数量。
完成下面两步后,将自动完成登录并继续当前操作。