💡
原文中文,约4100字,阅读约需10分钟。
📝
内容提要
Bert-vits2更新了版本V210,修正了日/英的bert对齐问题,效果进一步优化;对底模使用的数据进行优化和加量,减少finetune失败以及电音的可能性;日语bert更换了模型,完善了多语言推理。
🎯
关键要点
- Bert-vits2更新了版本V210,修正了日/英的bert对齐问题,效果进一步优化。
- 对底模使用的数据进行优化和加量,减少finetune失败以及电音的可能性。
- 日语bert更换了模型,完善了多语言推理。
- 高质量数据集应包含音色多样性、音频质量、多样的语音内容、语音平衡、覆盖不同音高、语音环境、长度和多样性。
- 下载并提取马督工的声音素材,使用you-get工具。
- 克隆Bert-vits2 V210项目并准备训练数据。
- 更换底模并下载所需模型,进行数据处理和训练。
- 模型训练后,修改配置文件以进行推理。
- 建议使用官方的Gradio版本进行推理,而非FastApi版本。
- 本项目用于Bert-vits2的研究和测试,复刻马督工的精神是每个人都可以做到的。
🏷️
标签
➡️