A Scalable Decentralized Reinforcement Learning Framework for UAV Target Localization Using Recurrent PPO
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种递归PPO模型,旨在解决多无人机协作不足的问题,能够在无GNSS/GPS信号环境中有效定位目标。单无人机模型的准确率为93%,双无人机模型为86%,且双无人机模型所需步骤更少,显示出在复杂环境中高效定位的潜力。
🎯
关键要点
-
本研究提出了一种递归PPO模型,旨在解决多无人机协作不足的问题。
-
该模型能够在无GNSS/GPS信号的环境中有效定位目标。
-
单无人机模型的准确率为93%。
-
双无人机模型的准确率为86%,且所需步骤更少。
-
研究显示双无人机模型在复杂环境中具有高效定位的潜力。
🏷️