💡
原文英文,约200词,阅读约需1分钟。
📝
内容提要
在资源受限的边缘设备上,用户定义的关键词识别存在挑战。我们提出了SLiCK方法,通过分析关键词长度分布,将其视为长度约束问题,从而提高识别效率。该方法采用多任务学习,结合匹配和编码模块,显著提升了Libriphrase数据集的识别效果。
🎯
关键要点
- 在资源受限的边缘设备上,用户定义的关键词识别面临挑战。
- 关键词通常受到最大长度的限制,但之前的研究对此利用不足。
- 通过分析关键词长度分布,可以将关键词识别视为长度约束问题。
- 提出了SLiCK方法,利用子序列进行长度约束的关键词识别。
- 引入了子序列级匹配方案,以更细粒度学习音频与文本的关系。
- SLiCK采用多任务学习方法,包括匹配模块和编码模块。
- 在Libriphrase数据集上,SLiCK显著提高了识别效果,AUC从88.52提高到94.9,EER从18.82降低到11.1。
➡️