小红花·文摘

本文提出了一个使用强化学习解决车辆路径问题的端到端框架。通过训练一个单一模型，模型能够实时生成近最优解决方案，无需重新训练。方法在解决负载容量VRP中优于启发式算法和Google的OR-Tools，同时计算时间可比。框架适用于其他VRP变体和组合优化问题。