强化学习解决带时间窗的随机车辆路径问题
原文中文,约400字,阅读约需1分钟。发表于: 。通过强化学习方法优化随机车辆路径问题,减少货物运输中的行程成本,提出一种新的模型,用于考虑不确定的行程成本和需求,以及确定的客户时间窗口,通过基于注意力的神经网络进行训练,实现路径成本的最小化,并超越基于蚁群算法的模型,在行程成本上减少了 1.73%,该模型独特地整合了外部信息,展现了在不同环境中的稳健性,对未来随机车辆路径问题研究和产业应用具有价值。
本文研究了带时间窗的车辆路径问题(VRPTW)和随机旅行时间,并提出了上下文随机VRPTW问题。通过特征变量和历史数据驱动规定模型,解决了最小化总运输成本和预期迟到惩罚的问题。实验结果表明,基于特征的样本平均近似优于现有方法和新方法。