春节档电影《哪吒 2》票房突破120亿,成为中国首部票房过百亿影片,跻身全球影史前10。配音艺术引发热议,声音克隆技术迅速发展,普通人可轻松复刻角色音色。三款主流开源模型(GPT-SoVITS、Fish Speech v1.4、F5-E2 TTS)各具特色,广泛应用于影视创作和趣味配音。
GPT-SoVITS是一个开源项目,用极少量的声音样本快速训练模型,完成文本到语音的转换。
本文介绍了将GPT-SoVITS接入SillyTavern-1.11.5项目的步骤,包括部署SillyTavern、Koboldcpp和GPT-SoVITS。SillyTavern是一个前端项目,需要后端api服务来生成对话文本。
超神经电视台在bilibili上线,每周直播AI实用课程和行业大会。Karpathy的AI大课将在下周五播放。hyper.ai官网上线多个文本类情感分析数据集。东南大学提出光伏电池缺陷检测模型,准确率达91.74%。RVC开源音色克隆项目GPT-SoVITS。两会期间,科技大佬提出AI建议。HyperAI与DT新材料合作举办AI技术在化学与材料科学科研中应用研讨会。热门百科词条包括拉普拉斯算子和世界模型。超神经电视台将播放多个AI相关节目。
语音技术是AI技术之一,应用广泛。大型云计算公司已开源AI语音能力,开发者可基于此搭建应用。音色克隆项目GPT-SoVITS开源后受到热捧,可通过提供5秒语音样本克隆语音。教程已上线,可自定义音色。
GPT-SoVITS是MacOs系统下的TTS项目,可在M系列芯片上训练和推理。需要安装FFMPEG和conda环境,克隆GPT-SoVITS项目并安装依赖。推理时可选择使用CPU或MPS,但MPS存在内存泄露问题。
本文介绍了使用faceswap和so-vits库进行视频二次创作,复刻电影《卡萨布兰卡》中的经典桥段。讲解了克隆faceswap项目、配置环境、构建训练集、进行模型训练和替换脸部的效果。提醒读者注意法律法规。
完成下面两步后,将自动完成登录并继续当前操作。