💡
原文中文,约7800字,阅读约需19分钟。
📝
内容提要
阿里达摩院自研的FunAsr是一款中文语音识别技术,与OpenAi的Whisper相媲美。FunAsr基于Paraformer非自回归端到端模型,具有高精度、高效率、便捷部署的优点,支持标点符号识别、低语音识别、音频-视觉语音识别等功能。通过对比测试,FunAsr在中文语音转写方面表现优秀,几乎每一条素材都进行了标注。与Whisper相比,FunAsr的模型参数更多,训练数据更丰富,因此在中文领域的语音识别效果更好。
🎯
关键要点
- 阿里达摩院自研的FunAsr是一款中文语音识别技术,性能与OpenAi的Whisper相媲美。
- FunAsr基于Paraformer非自回归端到端模型,具有高精度、高效率和便捷部署的优点。
- FunAsr支持标点符号识别、低语音识别和音频-视觉语音识别等功能。
- 通过对比测试,FunAsr在中文语音转写方面表现优秀,几乎每一条素材都进行了标注。
- FunAsr的模型参数更多,训练数据更丰富,因此在中文领域的语音识别效果更好。
- Whisper是OpenAi开源的语音识别技术,虽然在全球市场上表现突出,但在中文领域不如FunAsr。
- FunAsr的训练数据为60000小时的纯人工标注,而Whisper使用了680000小时的数据。
- FunAsr的中文语音转写效果优于Whisper,尽管Whisper的训练数据量更大。
➡️