MaskGCT: Local Deployment of AI Voice Cloning Model (Windows 11) Based on Python 3.11, TTS, Text-to-Speech
原文英文,约600词,阅读约需2分钟。发表于: 。前几天,又一款非自回归的文字转语音的AI模型:MaskGCT,开放了源码,和同样非自回归的F5-TTS模型一样,MaskGCT模型也是基于10万小时数据集Emilia训练而来的,精通中英日韩法德6种语言的跨语种合成。数据集Emilia是全球最大且最为多样的高质量多语种语音数据集之一。本次分享一下如何在本地部署MaskGCT项目,让您的显卡再次发烧。安装基础依赖首先确保本地已经安装好Pytho...
MaskGCT是一款新发布的非自回归文字转语音AI模型,支持多种语言,基于10万小时的Emilia数据集训练,用户可在本地部署。安装依赖后,通过推理脚本实现语音合成,语音质量接近真实,但运行成本较高。