本研究提出了颠倒强化学习(UDRL),旨在解决传统强化学习在可解释性方面的不足。实验结果表明,基于树的方法如随机森林在性能上与神经网络相当,但更具可解释性,从而提高了强化学习的透明性和安全性。
完成下面两步后,将自动完成登录并继续当前操作。