基于奖励引导的保守Q学习的乘车拼接与公共交通协调:离线训练与在线微调强化学习框架

📝

内容提要

本研究针对多模式交通网络中乘车拼接与公共交通之间的协调问题,提出了一种新颖的强化学习框架RG-CQL。通过离线训练和在线微调相结合的方法,我们显著提升了数据效率,并在现实案例研究中表明,该方法在乘车拼接与公共交通协同下的系统奖励表现比传统方法高出17%到22%。

🏷️

标签

➡️

继续阅读