我们提出了一种标准化的方法来比较算法在学习过程中避免高成本错误的能力。在深度强化学习的实际应用中,确保算法的学习安全性至关重要,例如自驾车在学习避免事故时无需实际经历。
完成下面两步后,将自动完成登录并继续当前操作。