DeepACO:神经增强的蚁群优化系统用于组合优化
原文中文,约300字,阅读约需1分钟。发表于: 。DeepACO 是一个利用深度强化学习来自动化启发式设计的通用框架,用于加强现有 ACO 算法的启发式措施并在未来 ACO 应用中省去繁琐的手动设计。作为一个神经增强元启发式方法,DeepACO 在八个组合优化问题上使用单个神经模型和一组超参数始终优于其 ACO 对应物。作为一种神经元组合优化方法,DeepACO 在经典路由问题上表现优于或与特定问题方法相当。
RL4CO是一个用于组合优化的强化学习基准测试,强调可扩展性和广义能力的重要性。实验表明,一些最新的最先进的方法落后于其前辈,需要更平衡的观点来评估神经网络CO求解器的性能。作者希望RL4CO将鼓励探索解决复杂现实世界任务的新型解决方案,并在https URL上公开发布了他们的库。