提出了一种新颖的用户定义关键词识别方法MM-KWS,利用多模态注册的文本和语音模板。通过提取音素、文本和语音嵌入,并与查询语音嵌入进行比较,以检测目标关键词。实验证明,MM-KWS在多种语言环境下适用,并整合了高级数据增强工具,提高了性能。
完成下面两步后,将自动完成登录并继续当前操作。