本研究提出了一种新框架,将补救措施视为多目标优化问题,解决了传统算法因假设成本函数可微而导致的次优解问题,并识别了帕累托最优解。实验表明,该框架在大规模图中的扩展性良好。
本文介绍了一种基于多臂赌博机的乐观方法,称之为多目标同时乐观优化(MO-SOO)。该算法通过结合多个多臂赌博机在多目标问题的可行决策空间中建立分层结构,以识别帕累托最优解。在 300 个双目标基准问题中,与三个随机算法进行比较,MO-SOO 表现出与顶尖随机算法一致的性能,即 SMS-EMOA 算法。
本文提出了一种通过深度强化学习和神经网络解决多目标优化问题的方法。通过分解问题为一组标量优化子问题,并建立神经网络模型,通过邻域参数传递策略和DRL训练算法优化所有子问题的模型参数,得到帕累托最优解。实验结果表明,该方法在多目标旅行商问题上具有泛化能力和快速解决速度。
完成下面两步后,将自动完成登录并继续当前操作。