CleanUNet 2:基于波形和频谱的混合语音降噪模型
该研究探讨了Wave-U-Net在语音增强中的应用,发现其可以提高多个指标,适合作为语音识别系统的预处理步骤。该结构在时域直接建模,考虑大的时间上下文信息的特点,相比原始的音乐中唱声分离系统,基于少量隐藏层的结构更适合语音增强。
原文约300字/词,阅读约需1分钟。
该研究探讨了Wave-U-Net在语音增强中的应用,发现其可以提高多个指标,适合作为语音识别系统的预处理步骤。该结构在时域直接建模,考虑大的时间上下文信息的特点,相比原始的音乐中唱声分离系统,基于少量隐藏层的结构更适合语音增强。