本文研究了一种让智能体通过内部仿真规划新动作的方法。智能体通过与不同环境交互收集数据,并在未知环境中规划目标导向的行动。实验证明智能体可以准确规划模拟台球游戏中的行动。
完成下面两步后,将自动完成登录并继续当前操作。