研究人员提出了一种新的方法来初始化实体强化学习策略,利用基于视觉语言模型的通用世界知识和可索引知识。他们在Minecraft和Habitat任务中评估了该方法,并发现基于通用VLMs提取的嵌入的训练策略表现更好。这项研究有望提高强化学习效果。
完成下面两步后,将自动完成登录并继续当前操作。