💡
原文中文,约1200字,阅读约需3分钟。
📝
内容提要
作者使用GLM ASR替代OpenAI的murmur进行语音转文本,发现GLM在中英混合语句识别上表现更佳,尽管对OpenAI的依赖令人不满,但GLM的识别率和输出质量令人满意。最终,作者修改了murmur代码以使用GLM ASR。
🎯
关键要点
- 作者使用GLM ASR替代OpenAI的murmur进行语音转文本。
- GLM在中英混合语句识别上表现更佳,识别率和输出质量令人满意。
- 作者对OpenAI的依赖表示不满,认为whisper API有时返回质量较差。
- 在测试中,GLM的识别效果优于OpenAI,尤其在古汉语处理上。
- 作者修改了murmur代码以使用GLM ASR,克服了技术障碍。
❓
延伸问答
GLM ASR与OpenAI的murmur相比有什么优势?
GLM ASR在中英混合语句识别上表现更佳,识别率和输出质量令人满意。
作者对OpenAI的murmur有哪些不满?
作者对OpenAI的依赖表示不满,认为whisper API有时返回质量较差。
作者是如何测试GLM ASR的?
作者用普通话朗读了李白的春夜宴桃李园序,并将音频文件输入GLM ASR和OpenAI进行横向对比。
GLM ASR的参数量是多少?
GLM ASR的参数量为1.5B。
作者如何克服技术障碍以使用GLM ASR?
作者修改了murmur的代码以使用GLM ASR,并在本地创建了一个python的虚拟环境。
GLM ASR在古汉语处理上表现如何?
GLM ASR在古汉语处理上表现优于OpenAI,输出结果更准确。
➡️