本研究提出了一种并行混合动作空间强化学习模型(PH-DDPG),用于自适应交通信号控制。该模型优化了信号相位和持续时间,解决了传统模型的序列决策问题,提高了决策的流畅性和实际应用的有效性。
完成下面两步后,将自动完成登录并继续当前操作。