小红花·文摘

本文介绍了一种新的离线强化学习方法——图决策Transformer（GDT），使用因果图建模输入序列，处理细粒度空间信息。实验表明，GDT在基于图像的Atari和OpenAI Gym上的性能可以与最先进的离线强化学习方法相媲美或超越。