小红花·文摘

本文介绍了一种利用生成对抗网络（GAN）和无监督算法从混响环境中提取训练音频数据的方法，以提高自动语音识别（ASR）系统的性能。研究提出的新去混响技术结合了3D场景信息和多模态学习，显著改善了音频信号质量和RIR估计，在多种声学任务中表现出色。