离线强化学习中的扩散模型作为高效规划器

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文介绍了一种名为“层次性扩散器”的规划方法,结合了层次化和基于扩散的规划的优点。该方法在更高的层次上采用“跳跃”规划策略,拥有更大的感受域,计算成本较低。实验证实了该方法在培训和规划速度方面的卓越性能和效率。同时,探讨了该方法在复合性的分布任务中提高泛化能力的情况。

原文中文,约400字,阅读约需1分钟。
阅读原文