异构动作空间中的迁移强化学习:子目标映射方法
📝
内容提要
本文针对异构动作空间中代理的迁移强化学习问题,提出了一种新的子目标映射方法。该方法可以在不同的动作空间中有效学习子目标,显著提高学习代理在新任务中的样本效率和训练时间。研究结果表明,通过这种映射,学习代理能够更快地掌握以往专家代理的成功策略。
➡️
本文针对异构动作空间中代理的迁移强化学习问题,提出了一种新的子目标映射方法。该方法可以在不同的动作空间中有效学习子目标,显著提高学习代理在新任务中的样本效率和训练时间。研究结果表明,通过这种映射,学习代理能够更快地掌握以往专家代理的成功策略。