面向公平高效的基于学习的拥塞控制
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法,用于改善城市交通网络中的自适应交通信号控制。该算法在优化性、鲁棒性和样本效率方面具有优势。
🎯
关键要点
-
提出了一种可完全扩展和去中心化的多智能体 A2C 算法。
-
该算法旨在改善城市交通网络中的自适应交通信号控制。
-
提高了可观测性和减少了学习难度。
-
在大型合成交通网格和摩纳哥城的实际交通网络中进行测试。
-
通过模拟高峰流量动态进行比较。
-
与独立 A2C 和独立 Q-learning 算法相比,表现出更好的优化性、鲁棒性和样本效率。
-
优于其他最先进的去中心化 MARL 算法。
🏷️
标签
➡️