异构动作空间中的迁移强化学习:子目标映射方法

📝

内容提要

本文针对异构动作空间中代理的迁移强化学习问题,提出了一种新的子目标映射方法。该方法可以在不同的动作空间中有效学习子目标,显著提高学习代理在新任务中的样本效率和训练时间。研究结果表明,通过这种映射,学习代理能够更快地掌握以往专家代理的成功策略。

➡️

继续阅读