DanZero+: 强化学习在贯蛋游戏中的统治力

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了使用深度强化学习技术的Meowjong AI,它是一款三人日本麻将Sanma的AI。通过定义二维数据结构编码游戏信息,使用卷积神经网络进行预训练,并通过自我对弈增强主要动作模型的性能,取得了在Sanma游戏中的领先地位。

🎯

关键要点

  • Meowjong 是一款使用深度强化学习技术的三人日本麻将 AI。
  • 定义了一种紧凑而信息丰富的二维数据结构,用于编码 Sanma 游戏中的信息。
  • 使用卷积神经网络对 Sanma 的动作进行预训练。
  • 通过自我对弈增强主要动作模型的性能。
  • Meowjong 在 Sanma 游戏中取得了领先地位。
➡️

继续阅读