促进动态车辆路径问题中的双边公平性

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文提出了一个使用强化学习解决车辆路径问题的框架,通过观察奖励信号和遵守可行性规则,找到给定分布采样问题实例的近最优解。通过策略梯度算法优化参数,模型能够实时生成解决方案,无需重新训练。在解决负载容量 VRP 的中等规模实例时,方法优于启发式算法和 Google 的 OR-Tools,同时计算时间可比。还探讨了分裂交付对解决质量的影响。框架可应用于其他 VRP 变体和组合优化问题。

原文中文,约400字,阅读约需1分钟。
阅读原文