本文提出了一种新的广义相位压力控制方法(G2P控制),旨在改善交通信号控制中的交通状态表示问题。该方法基于排队理论,考虑简单车道特征,显著优于现有启发式方法,G2P-XLight算法表现更佳。
本研究提出了一种并行混合动作空间强化学习模型(PH-DDPG),用于自适应交通信号控制。该模型优化了信号相位和持续时间,解决了传统模型的序列决策问题,提高了决策的流畅性和实际应用的有效性。
该研究提出FitLight框架,解决了基于强化学习的交通信号控制中的高学习成本和泛化能力差的问题,通过知识共享和混合压力代理设计,提高了控制策略的收敛速度和资源利用效率。
本研究提出了一种双阶段模糊方法FuzzyLight,旨在解决城市交通信号控制中的决策不准确和训练不稳定问题,提升信号决策效率48%,对交通管理具有重要影响。
本研究提出了一种自适应模块化模型(AMM),旨在解决交通信号控制中强化学习的高实验成本和城市差异问题。通过模块化和元学习,AMM在目标环境中表现出色,实验结果证明了其良好的实用性和泛化能力。
麻省理工学院研究人员提出了一种新算法,旨在提高强化学习模型在复杂任务中的效率。该算法通过选择最有效的任务进行训练,使AI在交通信号控制等领域的效率提升五到五十倍,降低训练成本,未来可应用于更复杂的问题。
本研究提出了一种新方法,解决了基于强化学习的交通信号控制中高维状态表示未能提升性能的问题,平均等待时间减少了17.9%。强调了车与基础设施通信的必要性,并探讨了模型压缩以提高计算效率。
本研究提出DiffLight模型,旨在解决交通信号控制中的数据缺失问题。该模型通过部分奖励条件扩散框架,有效捕捉交叉口的时空依赖性,提升了控制性能。实验结果表明,其在多种缺失场景下表现优异。
通过交通流理论和机器学习,提出了一种数据驱动和免费模拟器的交通信号控制框架。利用历史交通数据构建奖励推断模型,通过离线学习信号控制策略。实验证明该方法性能卓越,具有实际应用性。
完成下面两步后,将自动完成登录并继续当前操作。