Whisper 能否进行基于语音的上下文学习
原文中文,约300字,阅读约需1分钟。发表于: 。通过以语音为基础的上下文学习方法,本研究调查了由 OpenAI 发布的 Whisper 自动语音识别(ASR)模型的上下文学习能力。在应用于孤立词 ASR 时,实验结果表明使用任意大小的 Whisper 模型在两种方言中能够显著减少词错误率(WER),平均降低率为 32.3%。可应用于进一步提高上下文学习效率的基于 k 最近邻的示例选择技术能将平均相对 WER 减少率提高至...
该研究提出了一种全自动的方法来识别语音记录中的语音异常,以帮助评估语音障碍。该方法结合了CTC和基于编码器-解码器的自动语音识别模型,可以实现与人类水平相当的准确性来区分患有失语症的人与健康对照组的记录。