刘悦 ·

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

💡 原文中文，约7800字，阅读约需19分钟。

📝

内容提要

阿里达摩院自研的FunAsr是一款中文语音识别技术，与OpenAi的Whisper相媲美。FunAsr基于Paraformer非自回归端到端模型，具有高精度、高效率、便捷部署的优点，支持标点符号识别、低语音识别、音频-视觉语音识别等功能。通过对比测试，FunAsr在中文语音转写方面表现优秀，几乎每一条素材都进行了标注。与Whisper相比，FunAsr的模型参数更多，训练数据更丰富，因此在中文领域的语音识别效果更好。

🎯

关键要点

阿里达摩院自研的FunAsr是一款中文语音识别技术，性能与OpenAi的Whisper相媲美。
FunAsr基于Paraformer非自回归端到端模型，具有高精度、高效率和便捷部署的优点。
FunAsr支持标点符号识别、低语音识别和音频-视觉语音识别等功能。
通过对比测试，FunAsr在中文语音转写方面表现优秀，几乎每一条素材都进行了标注。
FunAsr的模型参数更多，训练数据更丰富，因此在中文领域的语音识别效果更好。
Whisper是OpenAi开源的语音识别技术，虽然在全球市场上表现突出，但在中文领域不如FunAsr。
FunAsr的训练数据为60000小时的纯人工标注，而Whisper使用了680000小时的数据。
FunAsr的中文语音转写效果优于Whisper，尽管Whisper的训练数据量更大。

🏷️

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

内容提要

关键要点

标签

继续阅读