机器学习中“First-Explore先探索”元学习是什么?
原文中文,约1100字,阅读约需3分钟。发表于: 。人类是探索的大师。 与机器强化学习RL不同的是:我们不是像RL那样通过尝试最大化奖励来探索,而是通过探索来获取信息! 这是标准RL机器学习速度比人类慢得多的主要原因。 我们提出了一个新的元RL框架(First-Explore),它有两个策略: 一个策略只学习探索(First-Explore), 一个策略只学习开发。...
First-Explore是一个新的元RL框架,通过学习智能探索策略来提高难以探索领域的性能。它引入了牺牲性探索,解决了标准RL中的问题,能够在极难的探索问题上实现人类水平的采样效率。该算法是解决未见过的硬探索领域的重要一步。