自动语音识别(ASR)用于韩国儿童言语音障碍发音诊断

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种改进的自动语音识别模型,用于儿童发音问题的诊断。该模型基于wav2vec 2.0 XLS-R模型,准确性达到90%。研究表明ASR模型能够简化发音错误诊断流程。

🎯

关键要点

  • 本研究提出了一种改进的自动语音识别模型,用于儿童发音问题的诊断。

  • 该模型基于wav2vec 2.0 XLS-R模型,准确性达到90%。

  • 模型旨在替代临床操作中的人工转录,识别实际发音而非已有单词。

  • 尽管在识别不清晰发音方面仍需改进,但模型能够简化发音错误诊断流程。

➡️

继续阅读