VizDoom 中的行为克隆
原文中文,约500字,阅读约需1分钟。发表于: 。通过只使用像素数据作为输入,本研究论文描述了训练自主智能体在游戏《毁灭战士 2》中通过模仿学习(IL)进行游戏的方法。我们还探讨了强化学习(RL)相对于 IL 在摄像机运动和轨迹数据方面的人类性,并通过行为克隆(behavioural cloning)研究了个体模型学习不同行为特征的能力。我们尝试模仿具有不同游戏风格的真实玩家的行为,发现我们可以训练出具有攻击性、被动性或比传统 AI...
本研究通过模仿学习训练自主智能体在《毁灭战士2》游戏中进行游戏,发现模仿学习在摄像机运动和轨迹数据方面比强化学习更接近人类行为。智能体可以模仿真实玩家的不同游戏风格,表现出攻击性、被动性或接近人类的行为。研究提出了在视频游戏中引入更多深度和接近人类行为的方法。模仿学习智能体在数据集中表现与普通玩家相当,优于最差的玩家,但性能不如强化学习方法强。