小红花·文摘

本研究提出了一种名为DRAGO的方法，旨在解决持续模型基础强化学习中的知识保留问题。DRAGO通过合成经验排练和记忆恢复，帮助智能体在不同任务中保持和发展其世界模型，从而提高学习和适应能力。实证评估表明，DRAGO在多种持续学习场景中优于现有方法。