自动语音识别(ASR)用于韩国儿童言语音障碍发音诊断
原文中文,约300字,阅读约需1分钟。发表于: 。本研究提出了一种自动语音识别模型,旨在诊断具有言语音韵障碍(SSDs)的儿童的发音问题,以替代临床操作中的人工转录。该模型使用 wav2vec 2.0 XLS-R 模型进行改进,以识别实际发音而不是已有单词,并通过与人工标注相匹配的预测准确性达到约 90% 的水平。尽管该模型在识别不清晰发音方面仍需改进,但本研究表明 ASR 模型能够简化临床领域中的复杂发音错误诊断流程。
本研究提出了一种改进的自动语音识别模型,用于儿童发音问题的诊断。该模型基于wav2vec 2.0 XLS-R模型,准确性达到90%。研究表明ASR模型能够简化发音错误诊断流程。