基于自由能范式和状态聚合的子目标发现

📝

内容提要

本文研究强化学习中的子目标发现问题,填补了在复杂任务分解中的空白。我们提出使用自由能范式来识别子目标状态,通过分析状态之间的不可预见性来实现任务的有效分解。实验结果表明,该方法在无任务先验知识的情况下,能够有效表现于复杂的导航任务,并具有较强的环境随机性鲁棒性。

➡️

继续阅读