超越莱文斯坦:利用多种算法实现稳健的字错误率计算和细化错误分类
原文中文,约300字,阅读约需1分钟。发表于: 。本文解决了自动语音识别中传统字错误率(WER)计算的局限性,特别是在标点和大小写等非语义差异方面的信息丢失。通过采用扩展的莱文斯坦距离算法,我们提出了一种非破坏性的基于令牌的方法,能够计算更加稳健的WER和其他正字法指标,并利用字符串相似性和语音算法对转录错误进行更细致的分类。研究表明,我们的方法在多个数据集上的效果与常用的WER计算方式相当,并提供了基于此的用例分析及互动可视化的网络应用。
本文提出了一种非破坏性的基于令牌的方法,用于解决自动语音识别中传统字错误率计算的局限性。该方法能够计算更加稳健的WER和其他正字法指标,并对转录错误进行更细致的分类。研究表明,该方法在多个数据集上的效果与常用的WER计算方式相当。