本研究提出了一种新方法PVDR,利用无标注视频数据进行强化学习预训练。通过视频预测任务,基于Transformer的CVAE学习视觉动态表示,从而提高政策学习效率。实验结果表明,PVDR显著改善了视频预训练效果。
完成下面两步后,将自动完成登录并继续当前操作。