Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
原文中文,约4900字,阅读约需12分钟。发表于: 。阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。中文文本标注优化Whisper经常被人诟病的一点是对中文语音转写后标点符号的支持不够完备。首先安装whisper:pipinstall...
阿里的FunAsr对Whisper中文领域的转写能力造成挑战,但通过中文文本标注优化,Whisper可以斗过FunAsr。使用transformers库可以提高中文识别准确度和效率。BELLE-2/Belle-whisper-large-v2-zh模型微调提升中文语音识别能力。通过标点模型对转写文本加标点是另一解决方案。Whisper开源模型通过transformers微调提高中文NLP性能。