基于深度强化学习的实时综合调度与闲置车队引导在餐饮配送平台中的应用
📝
内容提要
本研究针对餐饮配送平台在实时订单调度和闲置配送员引导方面的挑战,提出了一种基于强化学习的战略双控框架,旨在提升服务质量和盈利能力。通过将调度和引导模型化为马尔可夫决策过程,并利用深度强化学习进行训练,研究表明此框架能够有效改善配送效率和配送员工作负载分配的公平性,并缓解服务网络中的人员不足问题。
🏷️
标签
➡️