CrossMuSim:基于大语言模型的跨模态音乐相似性检索框架
📝
内容提要
本研究解决了音乐相似性检索中传统单模态方法无法有效捕捉复杂音乐关系的问题。提出了一种新颖的跨模态对比学习框架,利用文本描述指导音乐相似性建模,并通过在线抓取和大语言模型提示相结合的数据获取方法,显著提高了性能。实验结果表明,该框架在多个基准测试中均表现出显著的性能提升,具有广泛的应用潜力。
🏷️
标签
➡️