走向深度鼓音源分离
📝
内容提要
该研究介绍了 StemGMD,这是一个大规模的音频数据集,用于孤立的单乐器鼓音轨。使用真实的声音鼓套件合成每个音频剪辑,总共 1224 小时,是迄今为止最大的鼓音频数据集,也是第一个包含九件标准鼓套件的每个乐器的孤立音频剪辑。利用 StemGMD,研究者们开发了 LarsNet,一种新颖的深度鼓音源分离模型,并证明其在分离五个鼓声音轨方面的性能显著优于现有的非负谱时分解方法。
➡️