本研究提出了一种新的双曲面扩散推荐模型(HDRM),旨在克服扩散模型在推荐系统中的局限性,尤其是在处理物品的各向异性和方向性结构方面。实验结果表明,该模型在多个数据集上显著提高了推荐性能。
中科大与华为诺亚方舟联合提出了一种推荐大模型性能预测定律,首次定量分析了模型性能与数据规模和质量之间的关系。研究引入近似熵作为数据质量指标,克服了传统扩展定律的局限性,有效预测推荐模型的扩展潜力和最优参数配置。
本文介绍了多种推荐模型的研究进展,包括SCoRe、基于随机自注意力的模型、DPP损失函数、时间变化用户偏好建模和动态因果协作过滤模型。这些模型在数据稀疏性、冷启动问题和推荐准确性方面表现优越,实验结果显示其在真实数据集上均优于现有基准方法,具有良好的应用潜力。
本文介绍了SCoRe、SINE、Temporal Graph Sequential Recommender等推荐模型的创新,旨在通过用户行为和物品属性的历史信息提升推荐系统性能。研究表明,这些模型在多个真实数据集上优于传统方法,尤其在动态兴趣建模和负面反馈处理方面表现突出。
本文提出了一种基于注意力机制的推荐模型,旨在解决协同过滤中的稀疏性和用户兴趣变化问题。通过Aspect-aware Topic Model和Aspect-aware Latent Factor Model,模型有效整合用户偏好与项目特征,提升推荐的解释性和性能。此外,研究探讨了基于树的方法和多层次评价维度的评分系统,展示了在真实数据集上的良好效果。
本文提出了一种基于序列的累积交叉熵(CCE)损失函数,旨在提升序列推荐系统的性能,解决序列信息利用率低的问题。实验结果表明该损失函数有效,并展示了其在推荐模型中的应用潜力。
研究表明,嵌入坍塌现象限制了大规模推荐模型的可扩展性。为此,提出了多嵌入设计和两阶段模型选择框架,以提高模型选择效率。新技术Neural Input Search通过强化学习优化分类特征嵌入维度,优于传统方法。此外,研究探讨了数据选择问题,提出基于可扩展多样化模型选择的框架,并展示了其在多任务学习和深度特征选择中的应用。
抖音发布的论文发现用户的偏好随时间波动,推荐模型需要感知时间信息以提供个性化服务。论文提出了一种兴趣时钟方法,将用户兴趣按小时分割并存储在样本中。实验结果表明,高斯兴趣时钟优于其他方法。在线评估结果显示,兴趣时钟在排名任务中提升了用户活跃度和持续时间。然而,不同场景可能需要不同的时间感知建模方式,长期漂移也可能需要不同的时间建模策略。
本研究提出了Gradient Low-Rank Projection (GaLore)训练策略,实现了大规模语言模型的全参数学习,优化器状态内存使用减少65.5%。同时,针对深度学习推荐模型的内存容量问题,提出了Tensor Train分解,显著压缩模型大小而不影响准确性。
Meta推出的新一代AI芯片MTIA,专为数据中心设计,性能是第一代的三倍,具备256MB内存和1.3GHz频率,能够更快地训练推荐模型。Meta计划将其应用于生成性AI模型,随着AI需求增长,定制芯片竞争加剧。
本文介绍了多种基于异构信息网络的推荐模型,如NIRec、HCDIR和HERec,旨在解决冷启动问题并提升推荐性能。这些模型通过探索节点互动、应用卷积学习和结合内容特征,在实验中表现出色,显著改善了推荐效果。
该文介绍了一种名为MLET的技术,通过跨类别学习训练嵌入层的分解来产生优越嵌入。在多个点击率预测任务的推荐模型上进行测试时,MLET始终产生更好的模型,特别是对于罕见的项目。MLET允许模型的嵌入维度和模型大小分别减少高达16倍和平均减少5.8倍。
本文介绍了使用动态嵌入表训练推荐模型的方法,TFRA和TFRS是实现动态嵌入表的工具,动态嵌入表有三种类型,训练模型的代码和自定义回调函数也在文章中提供。
完成下面两步后,将自动完成登录并继续当前操作。