利用神经分析和合成框架进行端到端神经歌手消声的歌曲数据清洗

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

我们提出了一种数据清洗方法,利用神经分析和合成(NANSY++)框架训练了一种端到端神经分离模型(EEND)用于歌手分离。实验证明,我们的方法使分离误差率提高了 14.8 个百分点。

🎯

关键要点

  • 提出了一种数据清洗方法,利用神经分析和合成(NANSY++)框架。
  • 训练了一种端到端神经分离模型(EEND)用于歌手分离。
  • 通过预训练的 NANSY++ 将合唱声转化为干净、非重叠的音频信号。
  • 减轻了合唱声对独唱声的错误标注。
  • 在大部分歌曲数据包含合唱段落的情况下,有效训练 EEND 模型。
  • 通过对带有注释的流行二重唱歌曲数据集进行实验,分离误差率提高了 14.8 个百分点。
➡️

继续阅读