层次化多智能体强化学习在空战机动中的应用
原文中文,约200字,阅读约需1分钟。发表于: 。应用人工智能模拟空战场景吸引了越来越多的关注,本文提出了一种用于多个异构代理的空中对空战斗的层次化多代理强化学习框架,其中命令决策过程划分为两个抽象阶段,低级政策控制个体单位的行动,高级指挥官政策根据总体任务目标下达宏观指令,并通过针对预先训练的低级政策对任务目标进行训练,实验证明了我们设计的优点。
本研究使用深度强化学习开发了一个能在视距范围以外的空战模拟环境中运作的智能体,通过奖励机制不断提高其在空战中的角色和生成新的战术。该研究旨在探究使用虚拟模拟场景对训练有素的智能体进行互动并比较其表现的真实飞行员的能力,以开发能够与真实飞行员互动的代理。