CleanUMamba:使用通道剪枝的紧凑型Mamba网络进行语音去噪
原文中文,约300字,阅读约需1分钟。发表于: 。本研究旨在解决实时音频去噪中的模型效率问题。提出的CleanUMamba网络通过结构化通道剪枝实现了模型尺寸减少8倍,同时保持了音频质量,表现出卓越的去噪性能。实验结果表明,该模型在Interspeech 2020深度噪声抑制挑战中的表现优异,具备实际应用潜力。
研究提出了一种名为Mamba的可扩展状态空间模型用于语音增强。基于Mamba的SEMamba系统结合信号级距离和基于度量的损失函数,在VoiceBank-DEMAND数据集上取得了3.55的PESQ分数,与感知对比拉伸技术结合后提升至3.69。