小红花·文摘

本文研究了Wave-U-Net在语音增强中的应用，发现其在时域建模中能有效提升多个性能指标。提出了Deep Complex U-Net、SDFCN、PoCoNet和FullSubNet+等新型网络结构和方法，均在不同数据集上表现优异。同时，探讨了语音分离与增强的最新进展及其在自动语音识别中的应用潜力。

RelUNet：用于多通道语音增强的相对通道融合 U-Net

BriefGPT - AI 论文速递 ·

研究发现Wave-U-Net在语音增强中应用可提高多个指标，适合作为语音识别系统预处理步骤。

MBTFNet：多频段时间频率神经网络用于歌声增强

BriefGPT - AI 论文速递 ·

该研究探讨了Wave-U-Net在语音增强中的应用，发现其可以提高多个指标，适合作为语音识别系统的预处理步骤。该结构在时域直接建模，考虑大的时间上下文信息的特点，相比原始的音乐中唱声分离系统，基于少量隐藏层的结构更适合语音增强。

CleanUNet 2：基于波形和频谱的混合语音降噪模型

BriefGPT - AI 论文速递 ·