xLSTM-SENet是一种新型的单通道语音增强系统,基于扩展长短期记忆架构,克服了传统模型的局限性。它通过改进存储控制和增加容量,提高了语音质量和清晰度,适合计算资源有限的设备。评估结果表明,其性能优于多种先进模型。
本研究针对当前基于注意力的语音增强模型在处理输入序列长度时的可扩展性问题,提出了基于扩展长短期记忆(xLSTM)的单通道语音增强系统xLSTM-SENet。这一新方法通过对比分析显示,xLSTM及LSTM能够在多个模型规模上与当前最先进的Mamba和Conformer系统相匹配或超越。最优的xLSTM-SENet2模型在Voicebank+DEMAND数据集上的表现超过了现有的先进模型,展示...
完成下面两步后,将自动完成登录并继续当前操作。