高斯任务上下文与技能的元强化学习解耦
原文中文,约300字,阅读约需1分钟。发表于: 。离线元强化学习方法(即通过先前经验适应未见的目标任务)在机器人控制任务中至关重要。本文提出了一种名为分离式元强化学习(DCMRL)的框架,通过对任务上下文和技能的学习和探索进行量化和离散化,从而获取可推广的先前经验并在元测试阶段实现对未见目标任务的有效适应。实验证明,DCMRL 比先前的元强化学习方法具有更具推广性的先前经验,并在导航和机器人操纵连续控制任务中更加有效。
本文介绍了分离式元强化学习(DCMRL)框架,通过学习和探索任务上下文和技能,获取可推广的先前经验并在元测试阶段适应未见目标任务。实验证明,DCMRL比先前方法具有更具推广性的先前经验,并在导航和机器人操纵任务中更有效。