小红花·文摘

该文介绍了对Whisper语音识别模型的改进，通过在额外数据上微调和使用改进的解码算法，提高了在低资源语言方面的性能。使用Filter-Ends和Min Lookahead解码算法，WER相对于标准beam search平均减少了2.26。

BriefGPT - AI 论文速递 ·

研究提出了一种名为“Detect and Pass”的算法，用于解决语音助手对口吃人士不友好的问题。该算法通过对口吃音频帧分类器对音频进行筛选，并将结果传递到ASR模型中，提高其错误率的鲁棒性。研究结果显示，在不同的ASR系统上，WER的降低幅度达到了23.93%到71.67%。

BriefGPT - AI 论文速递 ·