小红花·文摘

First-Explore是一个新的元RL框架，通过学习智能探索策略来提高难以探索领域的性能。它引入了牺牲性探索，解决了标准RL中的问题，能够在极难的探索问题上实现人类水平的采样效率。该算法是解决未见过的硬探索领域的重要一步。