小红花·文摘

本研究提出了一种并行混合动作空间强化学习模型（PH-DDPG），用于自适应交通信号控制。该模型优化了信号相位和持续时间，解决了传统模型的序列决策问题，提高了决策的流畅性和实际应用的有效性。