无监督音乐音色转移的潜在扩散桥
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了音乐音色转移中在保持旋律结构的同时修改音色特征的难题。我们提出了一种基于双扩散桥的创新方法,通过CocoChorales数据集进行训练,效果优于现有的无监督音色转移模型,如VAEGAN和高斯流桥(GFB)。实验结果表明,此方法在音频距离和旋律保持方面表现更佳,并且可以通过调整高斯先验的噪声水平来控制旋律保留程度。
本研究提出了一种基于双扩散桥的创新方法,解决了音乐音色转移中的难题。通过CocoChorales数据集进行训练,效果优于现有的无监督音色转移模型。实验结果表明,此方法在音频距离和旋律保持方面表现更佳。可以通过调整高斯先验的噪声水平来控制旋律保留程度。