预训练视觉表示在基于模型的强化学习中的意外无效性

📝

内容提要

本文研究了预训练视觉表示(PVRs)在基于模型的强化学习(MBRL)中的表现,填补了这一领域的研究空白。尽管PVRs在无模型强化学习中表现良好,但我们的结果表明在MBRL中,它们的样本效率和泛化能力并不优于从头学习的表征。研究发现数据多样性和网络架构是影响泛化性能的关键因素。

🏷️

标签

➡️

继续阅读