鲁棒的跨病因和说话者无关的口齿不清语音识别

📝

内容提要

本文提出了一种说话者无关的口齿不清语音识别系统,旨在填补现有系统多为说话者依赖和自适应的空白。研究中采用Whisper模型,实现在SAP-1005数据集上识别准确率达到6.99%的字符错误率和10.71%的词错误率,展现了系统在不同说话者和病因的广泛适用潜力。

➡️

继续阅读