分布式能量存储系统的基于去中心化多智能体强化学习的电荷平衡策略

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种可完全扩展和去中心化的多智能体A2C算法,用于改善城市交通网络中的自适应交通信号控制。该算法在优化性、鲁棒性和样本效率方面优于其他去中心化MARL算法。

🎯

关键要点

  • 提出了一种可完全扩展和去中心化的多智能体A2C算法。
  • 该算法旨在改善城市交通网络中的自适应交通信号控制。
  • 提高了可观测性并减少了学习难度。
  • 在大型合成交通网格和摩纳哥城的实际交通网络中进行测试。
  • 通过模拟高峰流量动态进行比较。
  • 与独立A2C和独立Q-learning算法进行比较。
  • 结果显示该算法在优化性、鲁棒性和样本效率方面优于其他去中心化MARL算法。
➡️

继续阅读