本文介绍了使用深度强化学习技术的Meowjong AI,它是一款三人日本麻将Sanma的AI。通过定义二维数据结构编码游戏信息,使用卷积神经网络进行预训练,并通过自我对弈增强主要动作模型的性能,取得了在Sanma游戏中的领先地位。
完成下面两步后,将自动完成登录并继续当前操作。