通过提示调整和分词技术提高Whisper在印度语言中的准确性和速度
📝
内容提要
本研究解决了低资源语言(如印度语言)在自动语音识别中的准确性和速度问题。论文提出了两种新方法:一种是结合语言家族信息的提示调整,以提高语言相似性语言的准确性;另一种是新型分词器,以减少生成的token数量,从而加快Whisper的推理速度,实验结果表明这两种方法有效地平衡了最优的字错误率和推理速度。
➡️
本研究解决了低资源语言(如印度语言)在自动语音识别中的准确性和速度问题。论文提出了两种新方法:一种是结合语言家族信息的提示调整,以提高语言相似性语言的准确性;另一种是新型分词器,以减少生成的token数量,从而加快Whisper的推理速度,实验结果表明这两种方法有效地平衡了最优的字错误率和推理速度。