GLM ASR试用

GLM ASR试用

💡 原文中文,约1200字,阅读约需3分钟。
📝

内容提要

作者使用GLM ASR替代OpenAI的murmur进行语音转文本,发现GLM在中英混合语句识别上表现更佳,尽管对OpenAI的依赖令人不满,但GLM的识别率和输出质量令人满意。最终,作者修改了murmur代码以使用GLM ASR。

🎯

关键要点

  • 作者使用GLM ASR替代OpenAI的murmur进行语音转文本。
  • GLM在中英混合语句识别上表现更佳,识别率和输出质量令人满意。
  • 作者对OpenAI的依赖表示不满,认为whisper API有时返回质量较差。
  • 在测试中,GLM的识别效果优于OpenAI,尤其在古汉语处理上。
  • 作者修改了murmur代码以使用GLM ASR,克服了技术障碍。

延伸问答

GLM ASR与OpenAI的murmur相比有什么优势?

GLM ASR在中英混合语句识别上表现更佳,识别率和输出质量令人满意。

作者对OpenAI的murmur有哪些不满?

作者对OpenAI的依赖表示不满,认为whisper API有时返回质量较差。

作者是如何测试GLM ASR的?

作者用普通话朗读了李白的春夜宴桃李园序,并将音频文件输入GLM ASR和OpenAI进行横向对比。

GLM ASR的参数量是多少?

GLM ASR的参数量为1.5B。

作者如何克服技术障碍以使用GLM ASR?

作者修改了murmur的代码以使用GLM ASR,并在本地创建了一个python的虚拟环境。

GLM ASR在古汉语处理上表现如何?

GLM ASR在古汉语处理上表现优于OpenAI,输出结果更准确。

➡️

继续阅读