ASTER:面向口吃者的自动语音识别系统可访问性测试
原文中文,约200字,阅读约需1分钟。发表于: 。提供一种用于测试和分析自动语音识别系统性能的测试用例生成方法,该方法通过模拟真实的口吃语音并注入多种不同类型的口吃来生成有效的测试用例,并在评估中明显增加了评估的 ASR 系统的词误差率、匹配错误率和词信息损失。
研究提出了一种名为“Detect and Pass”的算法,用于解决语音助手对口吃人士不友好的问题。该算法通过对口吃音频帧分类器对音频进行筛选,并将结果传递到ASR模型中,提高其错误率的鲁棒性。研究结果显示,在不同的ASR系统上,WER的降低幅度达到了23.93%到71.67%。