本研究提出了LGR2,一种层次强化学习框架,用于解决机器人控制任务。实证分析显示,LGR2在稀疏奖励机器人导航和操作环境中成功率超过70%,并在真实世界场景中展现出色的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。