自动语音识别系统无关词错误率评估
原文中文,约300字,阅读约需1分钟。发表于: 。提出了一种用于 ASR 系统独立的 WER 估计的假设生成方法,通过使用语音相似或语言上更可能的替代词产生假设,并在域内数据上达到了与 ASR 系统相关的 WER 估计器相似的性能,在域外数据上实现了最先进的性能。
该研究提出了一种改进自动语音识别系统性能的方案,通过修正参考转录和改变评分方法,商业ASR系统的错误率可以低于5%,研究系统的表现记录下降至2.3%。研究还探索了计算oracle WER的方法,并比较了不同的表示方法。最终,使用密集网络和添加字典外单词的方法实现了0.18%的oracle WER。