小红花·文摘

本文介绍了Bayesian ranking bandit算法在在线学习排序中的应用，通过利用先前的知识提高效能。作者提出了自适应算法，解决了现有工作需要匹配真实先验的局限性，并将结果扩展到线性和广义线性模型。作者还考虑了点击反馈措施，并通过实验证明了算法的有效性。