音乐音频表示的对比学习中数据增强对局部嵌入特性的影响

原文约300字,阅读约需1分钟。发表于:

音频嵌入是理解大量音乐目录的关键工具,通过对比学习音乐音频嵌入,可以改善属性的局部化,提高最近邻检索准确性并实现最先进的性能。

该研究调查了在few-shot设置中对文本到音乐扩散模型进行个性化的工作。实验发现音频特定数据增强对系统性能有影响,并评估了不同的训练策略。研究结果表明相似度度量与用户偏好一致,并且个性化方法更容易学习到节奏音乐结构。该研究的代码、数据集和示例资料对研究社区开放。

相关推荐 去reddit讨论