利用神经分析和合成框架进行端到端神经歌手消声的歌曲数据清洗
原文中文,约300字,阅读约需1分钟。发表于: 。我们提出了一种数据清洗方法,利用神经分析和合成(NANSY++)框架训练了一种端到端神经分离模型(EEND)用于歌手分离。我们的方法通过利用预训练的 NANSY++ 将合唱声变为干净、非重叠的音频信号,从而减轻了合唱声对独唱声的错误标注,并在可用的歌曲数据大部分包含合唱段落的情况下,帮助有效训练 EEND 模型。通过对带有注释的流行二重唱歌曲数据集进行实验证明,我们的方法使分离误差率提高了...
我们提出了一种数据清洗方法,利用神经分析和合成(NANSY++)框架训练了一种端到端神经分离模型(EEND)用于歌手分离。实验证明,我们的方法使分离误差率提高了 14.8 个百分点。