本地训练,立等可取,30秒音频素材复刻霉霉讲中文音色基于Bert-VITS2V2.0.2
原文中文,约7100字,阅读约需17分钟。发表于: 。之前我们使用Bert-VITS2V2.0.2版本对现有的原神数据集进行了本地训练,但如果克隆对象脱离了原神角色,我们就需要自己构建数据集了,事实上,深度学习模型的性能和泛化能力都依托于所使用的数据集的质量和多样性,本次我们在本地利用Bert-VITS2V2.0.2对霉霉讲中文的音色进行克隆实践。霉霉讲中文的原始音视频地址:https://www.bilibili.com/video/BV1b...
本文介绍了使用Bert-VITS2V2.0.2版本对原神数据集进行本地训练的过程,包括数据集构建、切分、重采样和标注,解决过拟合问题以及模型推理。需要注意数据集质量和训练次数的平衡。