First-Explore是一个新的元RL框架,通过学习智能探索策略来提高难以探索领域的性能。它引入了牺牲性探索,解决了标准RL中的问题,能够在极难的探索问题上实现人类水平的采样效率。该算法是解决未见过的硬探索领域的重要一步。
完成下面两步后,将自动完成登录并继续当前操作。