小红花·文摘

研究人员提出了一种新的方法来初始化实体强化学习策略，利用基于视觉语言模型的通用世界知识和可索引知识。他们在Minecraft和Habitat任务中评估了该方法，并发现基于通用VLMs提取的嵌入的训练策略表现更好。这项研究有望提高强化学习效果。