通过交通流理论和机器学习,提出了一种数据驱动和免费模拟器的交通信号控制框架。利用历史交通数据构建奖励推断模型,通过离线学习信号控制策略。实验证明该方法性能卓越,具有实际应用性。
完成下面两步后,将自动完成登录并继续当前操作。