RelUNet:用于多通道语音增强的相对通道融合 U-Net 本研究解决了现有神经多通道语音增强模型在通道处理上的独立性问题,提出了一种新方法,通过从一开始就结合相对信息进行处理,以优化通道之间的信息融合。实验结果显示,该方法在语音增强指标上显著提升性能,具有较大的应用潜力。 研究显示,Wave-U-Net 结构在语音增强中表现优异,特别是在时域建模方面。在 VCTK 数据集测试中,该方法提升了多个指标。简化的隐藏层结构更适合语音增强,并为语音识别预处理提供了新方向。 VCTK 数据集 Wave-U-Net 多通道 时域建模 语音增强 语音识别