针对大型目录序贮器的降低交叉熵损失

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

本文提出了一种基于序列的累积交叉熵(CCE)损失函数,以提高推荐系统中序列信息的利用率。实验结果表明,该方法在不使用负采样的情况下,能够有效训练推荐模型并提升性能。此外,研究还引入了简化的采样Softmax交叉熵(SimCE),其效果优于传统的BPR和SSM。

🎯

关键要点

  • 提出了一种基于序列的累积交叉熵(CCE)损失函数,旨在提高推荐系统中序列信息的利用率。
  • 在不使用负采样的情况下,该方法有效训练了三种最先进的推荐模型,并在五个基准数据集上进行了广泛实验。
  • 传统的贝叶斯个性化排名(BPR)损失收敛较慢,且局部最优解不理想,部分原因是只考虑每个正样本一个负样本。
  • 引入的简化采样Softmax交叉熵(SimCE)在12个基准数据集上验证,性能明显优于BPR和SSM。
  • 研究表明,推荐系统在训练过程中始终受益于多个负样本的使用。

延伸问答

什么是累积交叉熵(CCE)损失函数?

累积交叉熵(CCE)损失函数是一种基于序列的损失函数,旨在提高推荐系统中序列信息的利用率。

该研究如何提高推荐系统的性能?

该研究通过引入累积交叉熵损失函数和简化的采样Softmax交叉熵(SimCE),在不使用负采样的情况下有效训练推荐模型,从而提高性能。

简化的采样Softmax交叉熵(SimCE)有什么优势?

SimCE在12个基准数据集上的验证显示,其性能明显优于传统的贝叶斯个性化排名(BPR)和采样Softmax交叉熵(SSM)。

为什么传统的BPR损失收敛较慢?

传统的BPR损失收敛较慢,部分原因是它仅考虑每个正样本一个负样本,忽视了其他未观察到项目的潜在影响。

推荐系统在训练过程中如何受益于多个负样本?

研究表明,推荐系统在训练过程中始终受益于多个负样本的使用,这有助于提高模型的性能。

该研究使用了哪些推荐模型进行实验?

该研究有效训练了三种最先进的推荐模型,并在五个基准数据集上进行了广泛实验。

➡️

继续阅读