本研究提出了一种新的对比学习方法,通过将其作为基于梯度的多目标优化问题,实现了平衡ELBO和对比目标的帕累托稳定解。实验证明,该框架在主题连贯性、主题多样性和下游性能方面始终产生更高性能的神经主题模型。
本文提出了一种通过深度强化学习和神经网络解决多目标优化问题的方法。通过分解问题为一组标量优化子问题,并建立神经网络模型,通过邻域参数传递策略和DRL训练算法优化所有子问题的模型参数,得到帕累托最优解。实验结果表明,该方法在多目标旅行商问题上具有泛化能力和快速解决速度。
完成下面两步后,将自动完成登录并继续当前操作。