本研究提出了一种基于领导-追随策略的层次化强化学习框架,旨在提升多无人机空战中的协作性能。该框架通过优化角色分配和三层结构设计,有效应对高维动作空间的挑战,并在模拟实验中验证了其效果。
完成下面两步后,将自动完成登录并继续当前操作。