利用神经分析和合成框架进行端到端神经歌手消声的歌曲数据清洗
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们提出了一种数据清洗方法,利用神经分析和合成(NANSY++)框架训练了一种端到端神经分离模型(EEND)用于歌手分离。实验证明,我们的方法使分离误差率提高了 14.8 个百分点。
🎯
关键要点
- 提出了一种数据清洗方法,利用神经分析和合成(NANSY++)框架。
- 训练了一种端到端神经分离模型(EEND)用于歌手分离。
- 通过预训练的 NANSY++ 将合唱声转化为干净、非重叠的音频信号。
- 减轻了合唱声对独唱声的错误标注。
- 在大部分歌曲数据包含合唱段落的情况下,有效训练 EEND 模型。
- 通过对带有注释的流行二重唱歌曲数据集进行实验,分离误差率提高了 14.8 个百分点。
➡️