步步为营,再思考一下:自我完善神经组合优化的序列解码
原文中文,约300字,阅读约需1分钟。发表于: 。基于神经组合优化的建设性方法将组合优化问题视为有限马尔可夫决策过程,通过一个神经策略网络指导的决策序列逐步构建解决方案。本文提出了一种简单的、与问题独立的基于序列抽样的自我改进学习的序列解码方法,通过修改策略以忽略先前抽样的序列,从而强制其仅考虑未见过的替代方案,从而增加解决方案的多样性。对于旅行推销员和有容量车辆路径问题的实验结果证明了其强大的性能,此外,我们的方法在作业车间调度问题上优于...
本文介绍了一种基于神经组合优化的建设性方法,通过神经策略网络逐步构建解决方案。实验证明该方法在旅行推销员和有容量车辆路径问题上具有强大性能,并在作业车间调度问题上优于之前的神经组合优化方法。