funasr语音识别,支持cpu - 乂墨EMO

阿里达摩院开源大型端到端语音识别工具包FunASR: FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。工具包的核心模型是Paraformer,这是一个非自回归的端到端语音识别模型,经过手动注释的普通话语音识别数据集进行了训练,该数据集包含60,000小时的语音数据。为了

阿里达摩院开源了FunASR语音识别工具包,核心模型Paraformer经过60,000小时普通话数据训练,具备高精度和热词定制能力,并提供语音活动检测和文本后处理模型,性能优于Whisper。

原文中文,约800字,阅读约需2分钟。发表于:
阅读原文