小红花·文摘

本文提出了一种名为LAMP的方法，利用Vision-Language Models的零样本能力作为预训练工具，生成探索奖励，以获得受语言条件约束的预训练策略。该方法可以在RLBench的机器人操作任务上启动样本效率高的学习。

BriefGPT - AI 论文速递 ·

本文提出了一种名为LAMP的方法，利用Vision-Language Models的零样本能力作为预训练工具，生成探索奖励，以获得受语言条件约束的预训练策略。该方法可以在RLBench的机器人操作任务上启动样本效率高的学习。

BriefGPT - AI 论文速递 ·