BriefGPT - AI 论文速递 ·

决策 ConvFormer: 元前馈中的局部过滤足以进行决策

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本文介绍了一种新的离线强化学习方法——图决策Transformer（GDT），它将输入序列建模为因果图，以捕捉不同概念之间的潜在依赖关系。GDT在图形输入处理中使用图形Transformer，并在视觉任务中使用一个可选的序列Transformer来处理细粒度空间信息。实验表明，GDT在基于图像的Atari和OpenAI Gym上的性能可以与最先进的离线强化学习方法相媲美或超越。

🎯

关键要点

介绍了一种新的离线强化学习方法——图决策Transformer（GDT）
GDT将输入序列建模为因果图，以捕捉不同概念之间的潜在依赖关系
GDT在图形输入处理中使用图形Transformer
在视觉任务中使用可选的序列Transformer处理细粒度空间信息
实验表明，GDT在基于图像的Atari和OpenAI Gym上的性能与最先进的离线强化学习方法相媲美或超越

🏷️

决策 ConvFormer: 元前馈中的局部过滤足以进行决策

内容提要

关键要点

标签

继续阅读