借助自我监督语音模型改进 NAM 合成语音的清晰度
📝
内容提要
我们提出了一种新颖的方法,利用自我监督和序列到序列学习技术显著提高非可听低语(NAM)到语音转换任务中的可理解性。与传统方法明确记录基准语音不同,我们的方法依赖于自我监督和语音到语音合成来模拟基准语音。尽管使用模拟语音,我们的方法在 Mel 频率倒谱失真(MCD)指标上超过当前最先进技术(SOTA)的改进幅度为...
➡️
我们提出了一种新颖的方法,利用自我监督和序列到序列学习技术显著提高非可听低语(NAM)到语音转换任务中的可理解性。与传统方法明确记录基准语音不同,我们的方法依赖于自我监督和语音到语音合成来模拟基准语音。尽管使用模拟语音,我们的方法在 Mel 频率倒谱失真(MCD)指标上超过当前最先进技术(SOTA)的改进幅度为...