通过 Stein 变分梯度下降的可微分任务与动作规划
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
STAMP是一种新算法,利用并行化和可微分仿真来高效地搜索多个不同的计划。该算法能够将离散和连续的任务和动作规划问题转化为能够使用变分推断求解的连续优化问题,并通过模仿学习引入动作抽象,将推断问题降维。实验表明,STAMP能够并行产生多个不同的计划,并比现有TAMP基准更有效地搜索计划。
🎯
关键要点
-
STAMP是一种新算法,利用并行化和可微分仿真高效搜索多个不同的计划。
-
STAMP将离散和连续的任务和动作规划问题转化为连续优化问题,使用变分推断求解。
-
算法基于Stein变分梯度下降算法和GPU并行化的可微分物理模拟器。
-
通过模仿学习引入动作抽象,降低推断问题的维度。
-
实验表明STAMP能够并行产生多个不同的计划,且比现有TAMP基准更有效。
➡️