本研究提出了一种新的混合离线-在线强化学习范式H2O,解决了传统方法的缺陷,并在多飞行器运动控制和空战模拟等领域展示了优越性。实验结果表明,H2O在跨领域任务中表现出高性能和灵活性,为复杂任务提供了新思路。
本研究使用深度强化学习开发了一个能在视距范围以外的空战模拟环境中运作的智能体,通过奖励机制不断提高其在空战中的角色和生成新的战术。该研究旨在探究使用虚拟模拟场景对训练有素的智能体进行互动并比较其表现的真实飞行员的能力,以开发能够与真实飞行员互动的代理。
完成下面两步后,将自动完成登录并继续当前操作。