详解深度学习中推荐系统的经典模型
💡
原文中文,约5100字,阅读约需12分钟。
📝
内容提要
DSSM模型采用BOW方式表示Query和Title,通过含有多个隐层的DNN将其表达为低维语义向量。匹配层通过余弦距离计算语义相似度,并通过softmax函数转化为后验概率。在训练阶段,通过极大似然估计最小化损失函数,使用随机梯度下降使模型收敛。DSSM采用字向量作为输入,可以减少切词的依赖,提高模型泛化能力。缺点是丧失了语序信息和上下文信息,预测结果不可控。
🎯
关键要点
- DSSM模型采用BOW方式表示Query和Title,通过DNN将其表达为低维语义向量。
- 匹配层通过余弦距离计算语义相似度,并通过softmax函数转化为后验概率。
- 训练阶段通过极大似然估计最小化损失函数,使用随机梯度下降使模型收敛。
- DSSM采用字向量作为输入,减少切词依赖,提高模型泛化能力。
- DSSM的缺点是丧失语序信息和上下文信息,预测结果不可控。
- DeepFM模型结合FM和DNN,快速训练并共享输入特征。
- FM模型能有效处理特征组合和高维稀疏矩阵问题。
- DNN部分将稀疏特征映射为稠密特征向量。
- DeepFM模型使用二值交叉熵作为损失函数,AUC作为模型评价指标。
- DSSM通过DNN将Query和Title映射为低维语义向量,计算语义相似度。
➡️