小红花·文摘

本研究提出了LGR2，一种层次强化学习框架，用于解决机器人控制任务。实证分析显示，LGR2在稀疏奖励机器人导航和操作环境中成功率超过70%，并在真实世界场景中展现出色的泛化能力。