轻声低语,藏在光芒下的语音转文字模型Whisper

原文约1600字,阅读约需4分钟。发表于:

ChatGPT的模型gpt-3.5-turbo发布当天,OpenAI还开源了一个语音转文本的模型:Whisper。但由于ChatGPT本身太过于耀眼,很多人都忽略了Whisper的存在。 我当时也是这样,我一度以为,Whisper也是一个API,需要发送POST请求到OpenAI的服务器上,然后它传回识别的结果。所以我很长一段时间一直都没有试用过这个模型。 直到前几天,我看到有人在少数派上面发了一篇文章,介绍他刚做的语音识别App,并且说这个App基于Whisper,完全不需要联网。我当时还奇怪,不联网你怎么调Whisper的API?于是我终于去认真了解了一下Whisper,发现它是OpenAI开源的语音转文字的模型,并不是API服务。这个模型只需要有Python就能本地离线运行,不需要联网。

OpenAI发布了语音转文本模型Whisper,可本地离线运行,识别效果超过国内许多大厂中文语音识别产品。使用Whisper配合ChatGPT可进行纠正,方便生成字幕,完全免费。

轻声低语,藏在光芒下的语音转文字模型Whisper
相关推荐 去reddit讨论