本文提出了一种新的广义相位压力控制方法(G2P控制),旨在改善交通信号控制中的交通状态表示问题。该方法基于排队理论,考虑简单车道特征,显著优于现有启发式方法,G2P-XLight算法表现更佳。
本研究提出了一种并行混合动作空间强化学习模型(PH-DDPG),用于自适应交通信号控制。该模型优化了信号相位和持续时间,解决了传统模型的序列决策问题,提高了决策的流畅性和实际应用的有效性。
FitLight提出了一种新颖的联邦模仿学习框架,旨在解决基于强化学习的交通信号控制方法在实际应用中的高学习成本和泛化能力差的问题。该框架支持在各种交通环境中即插即用,显著提高了控制策略的收敛速度和资源使用效率。
本研究提出了一种双阶段模糊方法FuzzyLight,旨在解决城市交通信号控制中的决策不准确和训练不稳定问题,提升信号决策效率48%,对交通管理具有重要影响。
本研究提出了一种自适应模块化模型(AMM),旨在解决交通信号控制中强化学习的高实验成本和城市差异问题。通过模块化和元学习,AMM在目标环境中表现出色,实验结果证明了其良好的实用性和泛化能力。
本研究提出了一种结合基础设施摄像头感知与强化学习的交通共模拟框架,旨在解决现有交通信号控制对完美车辆检测的假设。通过在CARLA环境中使用YOLO系统实时检测车辆,优化信号时机,从而提升交通流。结果表明,即使在检测条件不佳的情况下,MARL代理仍能显著改善交通状况。
麻省理工学院研究人员提出了一种新算法,旨在提高强化学习模型在复杂任务中的效率。该算法通过选择最有效的任务进行训练,使AI在交通信号控制等领域的效率提升五到五十倍,降低训练成本,未来可应用于更复杂的问题。
本研究提出了一种新方法,通过高维状态表示和高效深度强化学习优化交通信号控制,显著提高了性能,平均等待时间减少了17.9%。同时强调了车与基础设施通信的重要性,并探讨了通过剪枝提高计算效率。
本研究提出了DiffLight模型,旨在解决交通信号控制中的缺失数据问题。该模型结合部分奖励条件扩散框架,显著提升了在数据缺失情况下的控制性能,实验结果表明其在多种场景下表现优越。
本文介绍了多种基于深度强化学习和多智能体协作的交通信号控制与规划方法,旨在提升交通安全、效率和鲁棒性。这些方法包括无信号交叉口优化、适应性实时控制及基于区域划分的信号控制系统。研究表明,这些新算法在性能上显著优于现有方法,有效管理复杂城市交通流量。
本文介绍了多种基于深度强化学习的算法,旨在改善多智能体系统中的策略协作与交通信号控制。这些算法在城市交通、无人驾驶巡逻和紧急响应管理中表现优越,显著提高了效率和响应速度。
该论文探讨了强化学习在交通信号控制中的应用,提出了FRAP和LIT等多种方法,强调自适应控制和系统性思维的重要性。研究表明,基于马尔科夫决策过程和纳什均衡的算法在多个交叉口表现优越,数据驱动方法在真实环境中也取得了良好效果。
该论文探讨了强化学习在交通信号控制中的应用,提出了CVLight、DynamicLight和CityLight等新方法,并通过实验验证了其在提高交通效率和安全性方面的有效性。这些方法利用历史数据和深度学习技术,显著改善了交通流动性并减少了事故发生率。
本文介绍了一种可扩展的多智能体A2C算法,旨在优化城市交通信号控制。与独立A2C和Q-learning算法相比,该算法在优化性、鲁棒性和样本效率上表现更佳。此外,文章还探讨了多智能体强化学习在自动驾驶中的应用及未来研究方向。
本文探讨了基于强化学习的环保行车控制策略,表明全自动驾驶可降低燃油消耗18%和CO2排放25%。研究还提出多智能体强化学习方法优化交通信号控制,提升交通流量和安全性,强调智能城市交通管理的智能化和响应性。
本研究探讨了深度强化学习和多智能体强化学习在瑞利-贝纳德对流传热控制中的应用,显示出良好的控制效果,具有工业优化潜力。同时,提出了多种算法以提高交通信号控制和热控制的效率,验证了强化学习在这些领域的有效性。
本文提出了一种基于预测模型的强化学习方法,通过历史数据构建虚拟空间,平衡长期与短期奖励。该方法在Fed-Batch实验中优于现有技术。此外,研究探讨了风险敏感型强化学习在交通信号控制中的应用,提出了有效的估算和优化程序,确保算法收敛。
该研究提出了一种基于增强数据的强化学习方法MTLight,用于优化交通信号控制。该模型通过学习交通指标和构建辅助任务,在SUMO模拟环境中表现出色,训练时间缩短80%。实验结果表明,MTLight显著改善了车辆等待时间和排队长度,具有高度适应性和安全性。
本文介绍了LemgoRL基准工具,旨在提升强化学习在交通信号控制中的应用。研究提出在真实模拟环境中训练强化学习算法,以解决现有控制器的不足。实验结果表明,结合交通流理论和机器学习的方法具有优越性能,推动智能交通系统的发展。
本研究提出了一种将大型语言模型(LLMs)与交通信号控制系统结合的新方法,显著提高了交通流量管理效率。在传感器故障情况下,该方法平均等待时间减少20.4%。研究还探讨了基于强化学习的交通信号控制框架,提出了多智能体协作的在线规划方法,以应对城市交通拥堵问题,提升交通流量控制性能。
完成下面两步后,将自动完成登录并继续当前操作。