STAMP是一种新算法,利用并行化和可微分仿真来高效地搜索多个不同的计划。该算法能够将离散和连续的任务和动作规划问题转化为能够使用变分推断求解的连续优化问题,并通过模仿学习引入动作抽象,将推断问题降维。实验表明,STAMP能够并行产生多个不同的计划,并比现有TAMP基准更有效地搜索计划。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: