小红花·文摘

研究提出了检索增强决策变换器（RA-DT），通过外部记忆机制存储和检索经验，解决长剧集和稀疏奖励问题。在网格世界等环境中表现出色，展示了在复杂任务中的潜力。研究还探讨了多种上下文强化学习方法，提升了任务泛化能力和效率。