本文提出了一种新颖的模仿式强化学习框架,通过高效利用专家数据进行自主探索,提高了学习效率。实验结果表明,该框架在多阶段空战中表现出色,优于现有的强化学习和模仿学习方法,能够快速学习复杂的空中作战任务中的关键知识,成功率达到100%。
完成下面两步后,将自动完成登录并继续当前操作。