本文介绍了分离式元强化学习(DCMRL)框架,通过学习和探索任务上下文和技能,获取可推广的先前经验并在元测试阶段适应未见目标任务。实验证明,DCMRL比先前方法具有更具推广性的先前经验,并在导航和机器人操纵任务中更有效。
完成下面两步后,将自动完成登录并继续当前操作。