小红花·文摘

本文研究了一种让智能体通过内部仿真规划新动作的方法。智能体通过与不同环境交互收集数据，并在未知环境中规划目标导向的行动。实验证明智能体可以准确规划模拟台球游戏中的行动。