基于集中训练和分散执行的多智能体深度强化学习在交通基础设施管理中的应用
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一个多智能体深度强化学习框架,用于管理大型交通基础设施系统的全生命周期。该框架通过约束的部分可观测马尔可夫决策过程,解决了在存在不确定性、风险考量和有限资源的情况下,对交通基础设施进行优化管理的问题。通过开发一种名为 DDMAC-CTDE 的 Deep Decentralized Multi-agent Actor-Critic...
该文章介绍了一个用于管理交通基础设施系统的多智能体深度强化学习框架,通过解决不确定性、风险和资源有限性的问题,优化了交通基础设施的管理。该框架在美国弗吉尼亚州的一个交通网络应用中展示了优越的性能,通过开发一种名为DDMAC-CTDE的方法,提供了近乎最优的解决方案。