通过 Stein 变分梯度下降的可微分任务与动作规划
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一种名为 Stein Task and Motion Planning (STAMP) 的新算法,利用并行化和可微分仿真来高效地搜索多个不同的计划。STAMP 将离散和连续的任务和动作规划问题转化为能够使用变分推断求解的连续优化问题。我们的算法基于 Stein 变分梯度下降算法和在 GPU...
STAMP是一种新算法,利用并行化和可微分仿真来高效地搜索多个不同的计划。该算法能够将离散和连续的任务和动作规划问题转化为能够使用变分推断求解的连续优化问题,并通过模仿学习引入动作抽象,将推断问题降维。实验表明,STAMP能够并行产生多个不同的计划,并比现有TAMP基准更有效地搜索计划。