本研究提出了一种名为DRAGO的方法,旨在解决持续模型基础强化学习中的知识保留问题。DRAGO通过合成经验排练和记忆恢复,帮助智能体在不同任务中保持和发展其世界模型,从而提高学习和适应能力。实证评估表明,DRAGO在多种持续学习场景中优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。