实时互动网 ·

EchoFree—超轻量神经声学回声消除模型 | ASRU 2025

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

声学回声消除（AEC）是语音通信的重要技术，旨在实时分离近端语音与远端回声。西北工业大学提出的“EchoFree”模型采用超轻量级混合架构，仅需278K参数和30 MMACs计算量，适合资源受限设备，性能接近最先进的DeepVQE-S模型，为低延迟部署提供了新方案。

🎯

🔎

EchoFree模型通过超轻量级混合架构，显著降低了参数量和计算复杂度，使其在资源受限的设备上也能实现高效的回声消除。这一特性使得该模型在智能家居和移动设备等场景中具有广泛的应用潜力，能够提升语音通信的质量和用户体验。

EchoFree模型采用自监督学习（SSL）生成的嵌入向量，增强了模型的回声抑制能力。通过两阶段优化策略，模型能够在不同频段上进行精细调节，这种方法不仅提升了语音质量，也为未来的语音处理技术提供了新的思路。

与传统的自适应滤波算法相比，EchoFree在处理非线性回声方面表现更佳。尽管神经网络方法通常需要较高的计算资源，EchoFree的设计有效平衡了性能与资源消耗，为低延迟的实时通信提供了可行的解决方案。

❓

EchoFree模型采用超轻量级混合架构，仅需278K参数和30 MMACs计算量，适合资源受限设备。

声学回声消除技术旨在实时分离近端语音与远端回声，保障语音通信的质量和鲁棒性。

EchoFree模型结合线性滤波与神经后处理，利用Bark尺度的压缩功率谱表征，降低计算复杂度。

模型采用自监督学习生成的嵌入向量，通过两阶段优化策略显著增强回声抑制能力。

实验结果表明，EchoFree在ICASSP 2023盲测集上的性能显著提升，改善了频谱失真问题。

EchoFree模型在非线性回声抑制方面优于传统算法，同时具备更低的参数量和计算复杂度，适合边缘设备。

🏷️