本文介绍了一种新的离线强化学习方法——图决策Transformer(GDT),使用因果图建模输入序列,处理细粒度空间信息。实验表明,GDT在基于图像的Atari和OpenAI Gym上的性能可以与最先进的离线强化学习方法相媲美或超越。
完成下面两步后,将自动完成登录并继续当前操作。