预训练语言模型中的变压器作为自动语音识别编码器的有效性研究
原文中文,约300字,阅读约需1分钟。发表于: 。本文研究了变压器在预训练语言模型(PLMs)中作为自动语音识别(ASR)编码器的有效性,填补了这一领域的研究空白。研究表明,变压器在从文本数据中提取特征的能力可以有效转化为处理语音数据,从而显著提升ASR的性能。我们的实验结果显示,在多种ASR任务中,使用预训练语言模型的变压器能显著降低字符错误率(CER)和单词错误率(WER),尤其在需要深刻语义理解的场景中效果更为显著。
本文研究了变压器在自动语音识别中作为编码器的有效性。结果表明,变压器能将文本特征提取能力应用于语音数据,显著提升ASR性能,尤其在需要深刻语义理解的场景中效果更佳。