步步为营,再思考一下:自我完善神经组合优化的序列解码
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种基于神经组合优化的建设性方法,通过神经策略网络逐步构建解决方案。实验证明该方法在旅行推销员和有容量车辆路径问题上具有强大性能,并在作业车间调度问题上优于之前的神经组合优化方法。
🎯
关键要点
- 本文介绍了一种基于神经组合优化的建设性方法。
- 该方法将组合优化问题视为有限马尔可夫决策过程。
- 通过神经策略网络指导的决策序列逐步构建解决方案。
- 提出了一种基于序列抽样的自我改进学习的序列解码方法。
- 该方法通过修改策略忽略先前抽样的序列,增加解决方案的多样性。
- 实验结果显示该方法在旅行推销员和有容量车辆路径问题上表现强大。
- 在作业车间调度问题上,该方法优于之前的神经组合优化方法。
➡️