本研究提出了一种新的离线强化学习框架——时间距离感知转换增强(TempDATA),旨在解决因超出分布样本导致的性能下降问题。TempDATA通过在时间结构化的潜空间中生成增强过渡,能够模拟长期行为,提升多个测试任务的表现。
完成下面两步后,将自动完成登录并继续当前操作。