本文提出了生成对抗性探索(GAEX)方法,利用生成对抗网络的内在奖励来促进强化学习中的探索。实验证明,应用GAEX在DQN上可以显著提升探索性能,这是首次使用GAN解决强化学习中的探索问题。
完成下面两步后,将自动完成登录并继续当前操作。