多智能体图强化学习中的学习分散式交通信号控制器
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法,用于城市交通网络中的自适应交通信号控制。通过模拟高峰流量动态,并将其与独立 A2C 和独立 Q-learning 算法进行比较,结果表明其优化性、鲁棒性和样本效率优于其他最先进的去中心化 MARL 算法。
🎯
关键要点
- 提出了一种可完全扩展和去中心化的多智能体 A2C 算法。
- 该算法旨在提高城市交通网络中的自适应交通信号控制的可观测性和减少学习难度。
- 通过模拟高峰流量动态进行实验。
- 与独立 A2C 和独立 Q-learning 算法进行比较。
- 结果表明该算法在优化性、鲁棒性和样本效率上优于其他去中心化 MARL 算法。
➡️