GenPlan: Generative Sequence Models as Adaptive Planners
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了GenPlan框架,克服了离线强化学习在多任务决策中的局限性。通过生成序列建模,显著提升了对新环境的适应能力,实验结果显示其在自适应规划任务中的性能超过现有方法10%以上。
🎯
关键要点
-
本研究提出了GenPlan框架,旨在克服离线强化学习在多任务决策中的局限性。
-
当前的离线强化学习代理无法适应单一任务以外的情境,缺乏对新环境的泛化能力。
-
GenPlan框架采用生成序列建模的离散流模型,通过迭代去噪程序生成目标和行动序列。
-
实验结果显示,GenPlan在自适应规划任务中的性能超过现有方法超过10%。
🏷️