Autoverse是一种可扩展的、用于单人2D网格游戏的可进化的领域特定语言。它可以作为开放式学习算法的可扩展训练场。研究者使用Autoverse从搜索中的模仿学习来启动开放式学习,通过进化Autoverse环境生成复杂的环境和游玩轨迹,并使用模仿学习提炼专家游玩轨迹为基于神经网络的策略。最后,他们将学到的策略作为开放式强化学习的起点,不断进化新的训练环境,提高生成环境的可学习性和泛化性能。
完成下面两步后,将自动完成登录并继续当前操作。