深度强化学习用于实时地面延误计划修订与对应航班延误分配

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该论文研究了地面延误计划(GDP),通过强化学习技术开发了两个模型,旨在提高GDP的效率。结果显示模型在学习方面存在困难,讨论了挑战和模型在实际数据上的表现,并概述了未来方向。

🎯

关键要点

  • 该论文研究了地面延误计划(GDP),用于协调机场的容量和需求差异。

  • 通过强化学习技术,开发了两个模型:行为克隆(BC)和保守型 Q 学习(CQL)。

  • 模型旨在通过复杂的奖励函数提高GDP效率,考虑地面延误、空中延误和航站区域拥堵。

  • 使用2019年新瓦克自由国际机场的真实运行数据进行模拟,目标是提前设定机场计划速率。

  • 初始结果显示模型在学习方面存在困难,可能由于过于简化的环境假设。

  • 论文讨论了遇到的挑战,评估了模型在实际数据上的表现。

  • 概述了改进航空交通管理中强化学习应用的未来方向。

➡️

继续阅读