多语种 ASR 中新语种整合的低秩自适应双通道模型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了ICASSP Signal Processing Grand Challenge 2023中Spoken Language Understanding Grand Challenge的低资源领域适应赛道中的系统。使用ASR和NLU的流水线方法,通过微调Whisper和BART实现ASR和NLU。应用了MLM-based数据增强和基于检索的方法。在reminder/weather领域实现了63.3/75.0的精确匹配准确率,获得第一名。

🎯

关键要点

  • 本文介绍了ICASSP Signal Processing Grand Challenge 2023中的Spoken Language Understanding Grand Challenge的低资源领域适应赛道中的系统。
  • 采用ASR和NLU的流水线方法进行系统构建。
  • 对Whisper进行微调以实现ASR,并对BART进行微调以实现NLU。
  • 应用了基于MLM的遮蔽LM数据增强和基于检索的方法。
  • 在reminder/weather领域实现了63.3/75.0的精确匹配准确率,平均为69.15。
  • 在挑战中获得了第一名。
➡️

继续阅读