鲁棒的跨病因和说话者无关的口齿不清语音识别
📝
内容提要
本文提出了一种说话者无关的口齿不清语音识别系统,旨在填补现有系统多为说话者依赖和自适应的空白。研究中采用Whisper模型,实现在SAP-1005数据集上识别准确率达到6.99%的字符错误率和10.71%的词错误率,展现了系统在不同说话者和病因的广泛适用潜力。
➡️
本文提出了一种说话者无关的口齿不清语音识别系统,旨在填补现有系统多为说话者依赖和自适应的空白。研究中采用Whisper模型,实现在SAP-1005数据集上识别准确率达到6.99%的字符错误率和10.71%的词错误率,展现了系统在不同说话者和病因的广泛适用潜力。