阿里云通义千问团队开源两款语音基座模型 语音识别效果优于OpenAI Whisper模型
原文中文,约1400字,阅读约需4分钟。发表于: 。#人工智能 阿里云通义千问团队开源两款语音基座模型,SenseVoice 用于多语言语音识别,识别效果优于 OpenAI Whisper 模型,CosyVoice 模型则用于生成语音,支持跨语言语音克隆、指令跟随、情感控制等。这两款模型均基于 Apache 2.0 协议进行开源,开发者和企业均可免费商业性使用。查看全文:https://ourl.co/104845
阿里云通义千问团队开源了SenseVoice和CosyVoice两款语音基座模型,用于多语言语音识别和生成语音。这些模型采用Apache 2.0许可证,已在Modelscope和HuggingFace平台提供。SenseVoice的识别效果优于OpenAI Whisper模型。