基于强化学习的自适应交通信号控制
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过交通流理论和机器学习,提出了一种数据驱动和免费模拟器的交通信号控制框架。利用历史交通数据构建奖励推断模型,通过离线学习信号控制策略。实验证明该方法性能卓越,具有实际应用性。
🎯
关键要点
-
提出了一种数据驱动和免费模拟器的交通信号控制框架(D2TSC)。
-
结合交通流理论和机器学习进行交通信号控制。
-
利用历史交通数据构建奖励推断模型。
-
通过粗粒度的交通数据推断奖励信号。
-
使用样本高效的离线强化学习方法学习信号控制策略。
-
实验证明该方法在传统方法和离线强化学习基准上表现卓越。
-
该方法具有更好的实际应用性。
➡️