小红花·文摘

本研究提出了CleanMel，一个用于去噪和去混响的单通道梅尔谱网络，旨在提升语音质量和自动语音识别（ASR）性能。实验结果表明，该网络在处理噪声和混响录音时显著改善了语音质量和ASR效果。

BriefGPT - AI 论文速递 ·

本研究提出了一种变分贝叶斯推断框架（VINP），旨在解决混响语音信号的去混响和盲室冲激响应（RIR）识别问题。通过结合深度神经网络预测先验分布，显著提升了自动语音识别（ASR）和盲RIR识别的性能。

BriefGPT - AI 论文速递 ·

本研究提出了一种实时自动语音识别的新方法，结合去混响与降噪技术，利用WPD波束形成优化神经波束形成，显著提升了在不同条件下的语音识别性能。

BriefGPT - AI 论文速递 ·

本文提出了一种结合物理和机器学习的新框架，用于分析声学信号。该框架利用贝叶斯推断、神经物理模型和非线性最小二乘法，有效推断室内冲激响应，并介绍了多种去混响和声源分离的方法，展示了在不同声学条件下的优越性能。

BriefGPT - AI 论文速递 ·

Apple Machine Learning Research ·

本文提出了一种结合视觉线索和自监督学习的音频-视觉多通道语音分离与去混响方法。该研究结合扩散模型和音频-视频预训练框架，显著降低了训练时间和计算量，并在多个任务中超越了现有方法的表现。

BriefGPT - AI 论文速递 ·