Chess-GPT 的内部世界模型 [译]
原文中文,约7500字,阅读约需18分钟。发表于: 。在机器学习 (ML) 的众多近期进展中,有两个特别吸引我的。第一个是 gpt-3.5-turbo-instruct 在国际象棋中达到 1800 ELO 水平。一个大语言模型 (LLM) 能够仅凭网络上随机抓取的文本就学会下好棋,这似乎不可思议。第二个是 Kenneth Li 的论文《生成世界表示》。The Gradient 上有一篇精彩的摘要,以及 Neel Nanda...
本文介绍了Chess-GPT模型在国际象棋中的表现,通过分析500万局对局,达到了约1300 ELO的棋力。模型准确追踪棋盘状态,掌握多种规则,并预测玩家技能水平。Chess-GPT展现出令人印象深刻的表现。