本论文提出了一种新型混合算法,结合了自顶向下方法和模型无关强化学习的优点,以路线优化策略的形式为车队提供路线规划,优化街道叫车服务的路线。使用代理的大规模微观仿真平台评估算法在人工道路网络和新加坡道路网络中的表现,结果表明混合算法可以显著加速模型无关学习者的学习过程。
完成下面两步后,将自动完成登录并继续当前操作。