本研究提出了MAGELLAN元认知框架,旨在提高开放式学习智能体在广阔目标空间中的学习进展优先级和预测效率,并能动态适应目标空间的变化。
Autoverse是一种可扩展的、用于单人2D网格游戏的可进化的领域特定语言。它可以作为开放式学习算法的可扩展训练场。研究者使用Autoverse从搜索中的模仿学习来启动开放式学习,通过进化Autoverse环境生成复杂的环境和游玩轨迹,并使用模仿学习提炼专家游玩轨迹为基于神经网络的策略。最后,他们将学到的策略作为开放式强化学习的起点,不断进化新的训练环境,提高生成环境的可学习性和泛化性能。
该研究旨在定义开放式学习的基本属性,并探讨其与相关概念的区别与联系。开放式学习是一个复合概念,其核心特性是在无限时间内不断产生新元素,并以开放式目标条件下的强化学习问题为重点研究领域。
完成下面两步后,将自动完成登录并继续当前操作。