预测者:从像素到时间抽象的树搜索规划

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

PiZero是一种新的规划方法,能够在自主创建的抽象搜索空间中进行高层规划,并以复合或时间扩展的动作形式进行推理。该方法比之前的方法更通用,可以处理具有连续动作空间和部分可观察性的设置。在多个领域的评估中,PiZero方法优于可比较的之前方法,且无需假设访问环境模拟器。

🎯

关键要点

  • PiZero是一种新的规划方法,能够在自主创建的抽象搜索空间中进行高层规划。

  • 该方法支持复合或时间扩展的动作形式进行推理,适用于需要大量基础微动作的环境。

  • PiZero比之前的方法更通用,能够处理连续动作空间和部分可观察性的设置。

  • 在多个领域的评估中,PiZero方法优于可比较的之前方法。

  • 该方法无需假设访问环境模拟器。

➡️

继续阅读