面向公平高效的基于学习的拥塞控制

Astraea 是一种基于深度强化学习的拥塞控制算法，通过多智能体框架并在训练过程中显式优化收敛性质，以实现公平性和稳定性的快速收敛。

本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法，用于改善城市交通网络中的自适应交通信号控制。该算法在优化性、鲁棒性和样本效率方面具有优势。

优化性城市交通网络多智能体 A2C 算法自适应交通信号控制鲁棒性

原文中文，约200字，阅读约需1分钟。发表于：。

分享给好友