PiZero是一种新的规划方法,能够在自主创建的抽象搜索空间中进行高层规划,并以复合或时间扩展的动作形式进行推理。该方法比之前的方法更通用,可以处理具有连续动作空间和部分可观察性的设置。在多个领域的评估中,PiZero方法优于可比较的之前方法,且无需假设访问环境模拟器。
完成下面两步后,将自动完成登录并继续当前操作。