本研究提出了GenPlan框架,克服了离线强化学习在多任务决策中的局限性。通过生成序列建模,显著提升了对新环境的适应能力,实验结果显示其在自适应规划任务中的性能超过现有方法10%以上。
完成下面两步后,将自动完成登录并继续当前操作。