小红花·文摘

Autoverse是一种可扩展的、用于单人2D网格游戏的可进化的领域特定语言。它可以作为开放式学习算法的可扩展训练场。研究者使用Autoverse从搜索中的模仿学习来启动开放式学习，通过进化Autoverse环境生成复杂的环境和游玩轨迹，并使用模仿学习提炼专家游玩轨迹为基于神经网络的策略。最后，他们将学到的策略作为开放式强化学习的起点，不断进化新的训练环境，提高生成环境的可学习性和泛化性能。