BriefGPT - AI 论文速递 ·

稳健的 ASR 错误修正与保守数据过滤

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文探讨了自动语音识别（ASR）中的误差校正（AEC）技术，提出了无监督检测框架UCorrect和基于非自回归的拼写校正模型等多种方法，以解决低资源领域的问题。这些方法显著降低了词语错误率，并在多个基准测试中表现优异。

🎯

❓

自动语音识别（ASR）误差校正（AEC）技术旨在解决低资源领域的问题，通过改进识别准确性来降低词语错误率。

UCorrect框架的主要优势在于显著降低词语错误率（WER），无需微调可达6.83%，并且适用于不同解码策略和数据集。

该模型结合声学信息和文本假设，利用语义感知的数据增强模式，提升了基于上下文偏见的校正效果，名称召回率增益最高可达20.3%。

SoftCorrect方法通过概率检测单词正确性，集中进行错误单词的更正，从而改善了误差校正效果。

该模型采用特征提取、声学分离和掩码优化等复杂模块，使用对比学习框架和语音质量感知损失函数，表现优于最先进的性能。

这些技术在多个基准测试中表现优异，尤其是在CoNLL-2014、JFLEG和BEA-2019等测试中实现了最先进的性能。

🏷️