本研究提出了一种新颖的层次强化学习框架,通过自上而下的递归规划,成功应用于推箱子游戏。该代理能够生成长动作序列,无需领域知识,对解决复杂益智问题具有重要意义。
本文介绍了一种使用层次强化学习来增强语言表示的方法,通过整合知识图谱中的关系三元组到语言模型中,提升自然语言理解任务的性能。
完成下面两步后,将自动完成登录并继续当前操作。