一个混合的元学习和多臂匪徒方法用于上下文特定的多目标推荐优化
发表于: 。本研究解决了在线市场推荐系统面临的多目标平衡问题,通过提出Juggler-MAB方法,融合元学习和多臂匪徒算法,以克服现有多利益相关者推荐系统的局限性。该方法不仅提供初始权重预测,还能实时调整,以适应用户行为和市场条件的快速变化,显著提升了推荐系统的效果。
本研究解决了在线市场推荐系统面临的多目标平衡问题,通过提出Juggler-MAB方法,融合元学习和多臂匪徒算法,以克服现有多利益相关者推荐系统的局限性。该方法不仅提供初始权重预测,还能实时调整,以适应用户行为和市场条件的快速变化,显著提升了推荐系统的效果。