在多任务框架中的低资源爱尔兰语语音识别和方言识别

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文介绍了使用中级CTC(InterCTC)训练的混合CTC/Attention编码器-解码器模型在爱尔兰低资源语音识别(ASR)和方言识别(DID)中的应用。实验结果显示,与基线模型相比,DID准确率提高了10.8%,字误率性能接近TDNN-HMM模型。这种多任务方法展示了在爱尔兰低资源ASR和DID中的潜在优势。

🎯

关键要点

  • 使用中级CTC(InterCTC)训练的混合CTC/Attention编码器-解码器模型。
  • 探索了爱尔兰(盖尔语)低资源语音识别(ASR)和方言识别(DID)。
  • 与目前在ASR(TDNN-HMM)和DID(ECAPA-TDNN)训练的最佳模型进行对比。
  • 确定了最佳的InterCTC设置,并使用E-branchformer编码器训练了一个模型。
  • 实验结果显示,DID准确率提高了10.8%。
  • 字误率性能接近TDNN-HMM模型。
  • 这种多任务方法展示了在爱尔兰低资源ASR和DID中的潜在优势。
➡️

继续阅读