义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

💡 原文中文,约4100字,阅读约需10分钟。
📝

内容提要

Bert-vits2更新了版本V210,修正了日/英的bert对齐问题,效果进一步优化;对底模使用的数据进行优化和加量,减少finetune失败以及电音的可能性;日语bert更换了模型,完善了多语言推理。

🎯

关键要点

  • Bert-vits2更新了版本V210,修正了日/英的bert对齐问题,效果进一步优化。
  • 对底模使用的数据进行优化和加量,减少finetune失败以及电音的可能性。
  • 日语bert更换了模型,完善了多语言推理。
  • 高质量数据集应包含音色多样性、音频质量、多样的语音内容、语音平衡、覆盖不同音高、语音环境、长度和多样性。
  • 下载并提取马督工的声音素材,使用you-get工具。
  • 克隆Bert-vits2 V210项目并准备训练数据。
  • 更换底模并下载所需模型,进行数据处理和训练。
  • 模型训练后,修改配置文件以进行推理。
  • 建议使用官方的Gradio版本进行推理,而非FastApi版本。
  • 本项目用于Bert-vits2的研究和测试,复刻马督工的精神是每个人都可以做到的。
➡️

继续阅读