预训练视觉表示在基于模型的强化学习中的意外无效性
发表于: 。本文研究了预训练视觉表示(PVRs)在基于模型的强化学习(MBRL)中的表现,填补了这一领域的研究空白。尽管PVRs在无模型强化学习中表现良好,但我们的结果表明在MBRL中,它们的样本效率和泛化能力并不优于从头学习的表征。研究发现数据多样性和网络架构是影响泛化性能的关键因素。
本文研究了预训练视觉表示(PVRs)在基于模型的强化学习(MBRL)中的表现,填补了这一领域的研究空白。尽管PVRs在无模型强化学习中表现良好,但我们的结果表明在MBRL中,它们的样本效率和泛化能力并不优于从头学习的表征。研究发现数据多样性和网络架构是影响泛化性能的关键因素。