本研究针对人类贩运问题,提出了MATCHED数据集,包含27,619条文本和55,115张图像。研究表明,多模态特征能有效提升贩运者识别和验证的性能,强调了其在打击人类贩运中的应用价值。
本文探讨了多种推荐系统的改进方法,包括自我上下文关注模块、多视角伪标记、零-shot推荐和多模态特征利用。这些方法在视频学习和冷启动推荐中显著提高了用户偏好捕捉和推荐准确性。实验结果表明,提出的技术在多个数据集上表现优越,推动了推荐系统的发展。
本文介绍了新颖的RIS架构ReMamber及其在图像融合中的应用,结合Mamba块和多模态特征,提升了图像重建和目标检测性能。提出的FusionMamba和MambaDFuse模型在多模态图像融合任务中表现优异,展现了Mamba在跨模态融合中的潜力。此外,研究探讨了Mamba与Transformer的结合,提出MambaVision模型,在多个数据集上取得了最先进的性能。
我们提出了一种创新方法,通过对齐和绑定不同模态的时间序列表示,揭示多模态特征之间的潜在模式关联,解决了特征融合和对异质特征的依赖导致的扩展性问题,并在多个应用领域的时间序列数据集上验证了该方法的有效性。
我们提出了一种多模态预测变压器(MAT)架构,使用多模态特征和文本字幕预测未来动作。通过实验评估了预训练阶段的有效性,并展示了模型的优势。结果显示文本描述有助于更有效的动作预测。
本研究提出了一种基于图形的物品结构增强方法MM-GEF,通过将多模态特征的潜在物品结构与协作信号相结合,有效地改善了物品表示。实验证明了该方法在多模态推荐技术方面的系统改进。
完成下面两步后,将自动完成登录并继续当前操作。