小红花·文摘

本研究提出了GenPlan框架，克服了离线强化学习在多任务决策中的局限性。通过生成序列建模，显著提升了对新环境的适应能力，实验结果显示其在自适应规划任务中的性能超过现有方法10%以上。