本研究提出了AlphaZero-Edu,一个轻量级的教育导向强化学习框架,旨在解决现有框架的复杂性和可重复性问题。该框架采用模块化设计,优化资源利用,并在Gomoku比赛中表现优异,为学术研究和工业应用提供了易于接入的基准。
本研究提出了一种基于大型语言模型的五子棋AI系统,旨在解决五子棋战略规划中的挑战。该系统通过自我对弈和强化学习提升棋步选择能力,解决生成非法位置的问题,并通过并行评估减少处理时间。
本研究提出了Rapfi,旨在解决神经网络游戏AI在计算资源有限时的性能问题。Rapfi通过模式化代码本和增量更新机制,降低计算需求并保持高精度,最终在无GPU支持的环境中赢得GomoCup 2024冠军。
完成下面两步后,将自动完成登录并继续当前操作。