强化学习的红绿灯控制
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种实时交通信号灯控制方法,使用深度 Q 学习和奖励函数,考虑排队长度、延迟、旅行时间和吞吐量,动态决定相位变化。通过在中国杭州的一个路口验证,结果显示该方法显著改善了车辆等待时间、排队长度和总行程时间。
🎯
关键要点
-
本研究提出了一种实时交通信号灯控制方法。
-
该方法使用深度 Q 学习和奖励函数。
-
考虑的因素包括排队长度、延迟、旅行时间和吞吐量。
-
方法通过动态决定相位变化来适应当前交通状况。
-
在中国杭州的一个路口进行验证。
-
结果显示该方法显著改善了车辆等待时间(57.1% 至 100%)。
-
排队长度改善幅度为40.9% 至 100%。
-
总行程时间改善幅度为16.8% 至 68.0%。
-
与传统的固定信号计划相比,该方法效果显著。
➡️