小红花·文摘

本研究提出了通用降噪框架D4AM，用于改善嘈杂环境下声学模型性能。该框架通过反向梯度调整语音增强模型，考虑回归目标作为辅助损失，直接估计权重系数，避免额外训练成本。实验结果显示，相对于嘈杂输入，该框架在Google ASR API上相对WER降低24.65%，是首个实现回归和分类目标有效组合的通用预处理器。

D4AM：用于下游声学模型的通用去噪框架

BriefGPT - AI 论文速递 ·

该研究提出了一种新的两步法来压缩 Tiny 语音增强模型，使用知识蒸馏技术进行预训练，并提出了一种新的细粒度相似性保持 KD 损失函数。该方法在高压缩和低信噪比条件下表现出突出的改进，信噪失真比分别提高了0.9dB和1.1dB。

微型语音增强的两步知识蒸馏

BriefGPT - AI 论文速递 ·