小红花·文摘

该文介绍了一种离线强化学习方法，利用先前经验学习政策，解决了使用行为克隆的限制。作者提出了一种新方法，将状态重构特征学习纳入扩散策略中，以解决分布外泛化问题。作者在二维多模态上下文强化学习环境和 D4RL 基准任务上评估了该模型的性能，实现了最先进的结果。