本研究提出了一种新颖的层次强化学习框架,通过自上而下的递归规划,成功应用于推箱子游戏。该代理能够生成长动作序列,无需领域知识,对解决复杂益智问题具有重要意义。
完成下面两步后,将自动完成登录并继续当前操作。