将神经蒙特卡洛树搜索应用于无人信号灯多交叉口调度的研究

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于增强学习的交通信号控制方法CityLight,采用MAPPO框架实现多个智能体的协同控制,显著提升交通效率。实验结果显示,整体性能提高11.66%,迁移场景吞吐量提升22.59%。

🎯

关键要点

  • 交通信号控制是一种低成本措施,可以提高交通效率。
  • 提出了基于增强学习的交通信号控制方法CityLight。
  • CityLight采用参数共享的MAPPO优化框架实现多个智能体的协同控制。
  • 该方法适配大规模异质交叉口,采用邻域集成奖励以达到全局最优。
  • 实验结果显示整体性能提升11.66%。
  • 在迁移场景中,吞吐量提升22.59%。
➡️

继续阅读