强化学习的红绿灯控制
原文中文,约300字,阅读约需1分钟。发表于: 。本研究提出一种实时交通信号灯控制方法,使用深度 Q 学习,并结合奖励函数,考虑排队长度、延迟、旅行时间和吞吐量,通过根据当前交通状况动态决定相位变化。通过使用合成和实际交通流数据在中国杭州的一个路口进行验证,结果表明与传统的固定信号计划相比,该方法显著改善了车辆等待时间(57.1% 至 100%)、排队长度(40.9% 至 100%)和总行程时间(16.8% 至 68.0%)。
本研究提出了一种实时交通信号灯控制方法,使用深度 Q 学习和奖励函数,考虑排队长度、延迟、旅行时间和吞吐量,动态决定相位变化。通过在中国杭州的一个路口验证,结果显示该方法显著改善了车辆等待时间、排队长度和总行程时间。