强化学习的红绿灯控制

本研究提出一种实时交通信号灯控制方法，使用深度 Q 学习，并结合奖励函数，考虑排队长度、延迟、旅行时间和吞吐量，通过根据当前交通状况动态决定相位变化。通过使用合成和实际交通流数据在中国杭州的一个路口进行验证，结果表明与传统的固定信号计划相比，该方法显著改善了车辆等待时间（57.1% 至 100%）、排队长度（40.9% 至 100%）和总行程时间（16.8% 至 68.0%）。

本研究提出了一种实时交通信号灯控制方法，使用深度 Q 学习和奖励函数，考虑排队长度、延迟、旅行时间和吞吐量，动态决定相位变化。通过在中国杭州的一个路口验证，结果显示该方法显著改善了车辆等待时间、排队长度和总行程时间。

吞吐量奖励函数实时交通信号灯控制方法延迟排队长度旅行时间杭州深度 Q 学习