DanZero+: 强化学习在贯蛋游戏中的统治力
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了使用深度强化学习技术的Meowjong AI,它是一款三人日本麻将Sanma的AI。通过定义二维数据结构编码游戏信息,使用卷积神经网络进行预训练,并通过自我对弈增强主要动作模型的性能,取得了在Sanma游戏中的领先地位。
🎯
关键要点
- Meowjong 是一款使用深度强化学习技术的三人日本麻将 AI。
- 定义了一种紧凑而信息丰富的二维数据结构,用于编码 Sanma 游戏中的信息。
- 使用卷积神经网络对 Sanma 的动作进行预训练。
- 通过自我对弈增强主要动作模型的性能。
- Meowjong 在 Sanma 游戏中取得了领先地位。
➡️