本研究提出了一种名为RL-LLM-DT的自动决策树生成方法,结合强化学习和大型语言模型,解决了传统决策树在两人零和游戏中需大量人工干预的问题。该方法通过迭代自动改进决策树,显著提升了AI在冰壶游戏中的表现。
完成下面两步后,将自动完成登录并继续当前操作。