ASTER:面向口吃者的自动语音识别系统可访问性测试

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

研究提出了一种名为“Detect and Pass”的算法,用于解决语音助手对口吃人士不友好的问题。该算法通过对口吃音频帧分类器对音频进行筛选,并将结果传递到ASR模型中,提高其错误率的鲁棒性。研究结果显示,在不同的ASR系统上,WER的降低幅度达到了23.93%到71.67%。

🎯

关键要点

  • 研究提出了一种名为“Detect and Pass”的算法。

  • 该算法旨在解决语音助手对口吃人士不友好的问题。

  • 算法通过上下文相关的对口吃音频帧分类器筛选音频。

  • 筛选结果被传递到ASR模型中,提高错误率的鲁棒性。

  • 研究结果显示,WER的降低幅度在不同ASR系统上达到了23.93%到71.67%。

➡️

继续阅读