小红花·文摘

本文介绍了一种新型混合决策方法PA-MCTS，结合强化学习与计划，提升了在非稳态环境中的决策能力。研究还提出了多种基于强化学习的路径规划和动态避障方法，显示出在复杂环境中的有效性和性能提升，具有重要应用潜力。