面向多智能体强化学习交通信号控制中的依赖动态
📝
内容提要
本研究针对在复杂城市交通网络中应用于自适应交通信号控制的多智能体强化学习(MARL)面临的挑战,提出了一种新颖的动态参数更新策略。研究表明,在无溢流拥堵情况下,利用独立强化学习可实现优化的全球Q值,而在存在溢流拥堵时,则需采用集中式强化学习以达到最佳效果。所提出的DQN-DPUS策略在实验中显示了加快收敛速度的潜力,而并未降低搜索的最优性。
🏷️
标签
➡️