通过 Stein 变分梯度下降的可微分任务与动作规划

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

STAMP是一种新算法,利用并行化和可微分仿真来高效地搜索多个不同的计划。该算法能够将离散和连续的任务和动作规划问题转化为能够使用变分推断求解的连续优化问题,并通过模仿学习引入动作抽象,将推断问题降维。实验表明,STAMP能够并行产生多个不同的计划,并比现有TAMP基准更有效地搜索计划。

原文中文,约400字,阅读约需1分钟。
阅读原文