Skipper是一种基于模型的强化学习代理,利用空间和时间抽象来推广学到的技能,实现稀疏决策和任务分解。与基于层次规划的方法相比,Skipper具有性能保证和零样本泛化优势。
完成下面两步后,将自动完成登录并继续当前操作。