本文介绍了一种新型混合决策方法PA-MCTS,结合强化学习与计划,提升了在非稳态环境中的决策能力。研究还提出了多种基于强化学习的路径规划和动态避障方法,显示出在复杂环境中的有效性和性能提升,具有重要应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。