灵活的游戏智能体:使用 AlphaViT 适应多种游戏和棋盘尺寸
原文中文,约500字,阅读约需1分钟。发表于: 。本研究解决了AlphaZero框架在固定棋盘尺寸上的局限,提出了基于视觉变换器的灵活游戏智能体AlphaViT、AlphaViD和AlphaVDA。通过实验,这些智能体在多种游戏环境中表现优越,尤其是AlphaViD在适应不同动作空间和棋盘尺寸方面展现出更强的能力,展示了变换器结构在游戏AI开发中的潜力。
该论文介绍了MiniZero,一种支持四种先进算法的零知识学习框架,并通过评估这些算法在棋盘游戏和Atari游戏中的性能表现。在棋盘游戏中,使用更多模拟会产生更高的性能;在Atari游戏中,MuZero和Gumbel MuZero都值得考虑。论文还介绍了一种渐进式模拟的方法,在训练过程中逐渐增加模拟预算,取得了显著优异的性能。该论文为零知识学习算法的未来研究提供了基准。