小红花·文摘

机器之心 ·

本研究提出了一种新方法PVDR，利用无标注视频数据进行强化学习预训练。通过视频预测任务，基于Transformer的CVAE学习视觉动态表示，从而提高政策学习效率。实验结果表明，PVDR显著改善了视频预训练效果。

BriefGPT - AI 论文速递 ·