基于情感价值和唤醒度的多模态匹配

📝

内容提要

本研究解决了跨图像、音乐和音乐说明的情感内容匹配问题。提出的多模态匹配框架MMVA通过扩展IMEMNet数据集,采用基于情感价值和唤醒度的连续匹配评分,达到最先进的结果,并在零样本任务中展示了预测的有效性,预示着其在实际应用中的潜力。

🏷️

标签

➡️

继续阅读