无搜索的中国象棋人工智能的掌握
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了中国象棋人工智能在无需搜索算法情况下的性能提升问题。采用监督学习与强化学习相结合的方法,本AI系统展示了相当于前0.1%的顶级人类玩家的竞争力,并显著提高了训练效率和效果。最重要的发现表明,Transformer架构在性能上优于CNN,同时引入对手选择池可加速AI成长。
研究显示,机器学习的进步主要依赖于大规模数据和注意力机制。通过在一千万局国际象棋比赛数据上训练一个含2.7亿参数的transformer模型,并利用Stockfish 16引擎注释棋盘,获得约150亿数据点,模型达到了2895的Lichess快棋等级。无需特定优化或搜索算法,模型解决了复杂棋局,性能超过了AlphaZero的策略和值网络及GPT-3.5-turbo-instruct。研究强调规模对性能的重要性,并通过实验验证设计选择和超参数。