将神经蒙特卡洛树搜索应用于无人信号灯多交叉口调度的研究
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于增强学习的交通信号控制方法CityLight,采用MAPPO框架实现多个智能体的协同控制,显著提升交通效率。实验结果显示,整体性能提高11.66%,迁移场景吞吐量提升22.59%。
🎯
关键要点
- 交通信号控制是一种低成本措施,可以提高交通效率。
- 提出了基于增强学习的交通信号控制方法CityLight。
- CityLight采用参数共享的MAPPO优化框架实现多个智能体的协同控制。
- 该方法适配大规模异质交叉口,采用邻域集成奖励以达到全局最优。
- 实验结果显示整体性能提升11.66%。
- 在迁移场景中,吞吐量提升22.59%。
➡️