SLiCK:利用子序列进行长度约束的关键词识别

SLiCK:利用子序列进行长度约束的关键词识别

💡 原文英文,约200词,阅读约需1分钟。
📝

内容提要

在资源受限的边缘设备上,用户定义的关键词识别存在挑战。我们提出了SLiCK方法,通过分析关键词长度分布,将其视为长度约束问题,从而提高识别效率。该方法采用多任务学习,结合匹配和编码模块,显著提升了Libriphrase数据集的识别效果。

🎯

关键要点

  • 在资源受限的边缘设备上,用户定义的关键词识别面临挑战。
  • 关键词通常受到最大长度的限制,但之前的研究对此利用不足。
  • 通过分析关键词长度分布,可以将关键词识别视为长度约束问题。
  • 提出了SLiCK方法,利用子序列进行长度约束的关键词识别。
  • 引入了子序列级匹配方案,以更细粒度学习音频与文本的关系。
  • SLiCK采用多任务学习方法,包括匹配模块和编码模块。
  • 在Libriphrase数据集上,SLiCK显著提高了识别效果,AUC从88.52提高到94.9,EER从18.82降低到11.1。
➡️

继续阅读