基于不确定性自适应规划的动态障碍物回避

本研究解决了在动态环境中进行碰撞避免的挑战，特别是针对移动障碍物的适应性决策问题。我们提出了一种自适应生成规划方法，根据动作预测的不确定性动态调整重新规划频率，从而减少计算开销并保持有效的碰撞避免性能。实验结果显示，该方法在长时间规划中，平均轨迹长度提高了13.5%，平均奖励提升了12.7%，有效降低了碰撞率，改善了安全导航能力。

本文提出了一种结合监督学习和强化学习的两步方法用于动态避障。首先，通过循环神经网络估计障碍物的碰撞风险，然后将风险值纳入强化学习智能体的观察空间，提升环境感知。实验结果显示，该方法能有效减少碰撞，提高奖励，与具体强化学习算法无关。

动态避障强化学习循环神经网络监督学习碰撞风险