FitLight提出了一种新颖的联邦模仿学习框架,旨在解决基于强化学习的交通信号控制方法在实际应用中的高学习成本和泛化能力差的问题。该框架支持在各种交通环境中即插即用,显著提高了控制策略的收敛速度和资源使用效率。
完成下面两步后,将自动完成登录并继续当前操作。