LOTUS：无监督技能发现的机器人操控持续模仿学习

LOTUS 是一种持续模仿学习算法，使物理机器人能够在其寿命期内持续而高效地学习解决新的操作任务。通过使用一个开放词汇表视觉模型进行持续的技能发现过程，LOTUS 能构建一个不断增长的技能库，从一系列以少量人类示范展示的新任务中提取技能，并通过训练一个元控制器灵活地组合各种技能来解决基于视觉的操作任务，显示出比先前方法更强的知识传递能力。

该研究提出了一种自我监督任务推理方法，使用自组织学习和联合动作-意图嵌入的学习训练任务推理网络，并通过强化学习进行训练，以优化任务的性能。该方法在人形机器人上进行评估，性能优于其他基线，尤其在具有挑战性的情况下，并且能够从不完整的演示中推断出任务。在单次任务泛化实验中，该方法还显示出对未见任务的推理能力。

任务推理强化学习无监督机器人联合动作-意图嵌入自我监督自组织学习