本研究提出了一种结合延迟奖励的内容探索新方法,以提高推荐系统中用户的长期满意度。通过开发预测模型和强盗算法,实验证明该方法在播客推荐中显著优于传统方法,对推荐系统优化具有重要意义。
完成下面两步后,将自动完成登录并继续当前操作。