联合警务巡逻与调度的多智能体强化学习
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种可完全扩展和去中心化的多智能体A2C算法,用于改善城市交通网络中的自适应交通信号控制。该算法在优化性、鲁棒性和样本效率方面具有优势。
🎯
关键要点
- 提出了一种可完全扩展和去中心化的多智能体A2C算法。
- 该算法旨在提高城市交通网络中的自适应交通信号控制的可观测性。
- 算法减少了学习难度,适用于大型合成交通网格和摩纳哥城的实际交通网络。
- 通过模拟高峰流量动态,算法与独立A2C和独立Q-learning算法进行了比较。
- 结果表明,该算法在优化性、鲁棒性和样本效率方面优于其他最先进的去中心化MARL算法。
➡️