💡
原文中文,约17300字,阅读约需42分钟。
📝
内容提要
本文介绍了如何构建训练集、进行数据清洗和切分。训练集需要选择具有歌手音色特质的歌曲,并使用noisereduce库进行降噪处理。数据切分可以使用audio-slicer库,将清唱样本切成小样本。最后,给出了训练配置文件,并介绍了如何进行训练。
🎯
关键要点
- 构建训练集需要选择具有歌手音色特质的歌曲。
- 训练集的作用是为模型提供学习材料,通过反复迭代优化模型。
- 训练集数据贵精不贵多,特征权重高的清晰样本效果更好。
- 训练集的数量和质量都很重要,需要进行数据清洗和增强。
- 数据清洗包括去掉伴奏、停顿和混音部分,只保留清唱版本。
- 使用spleeter库进行伴奏和人声分离,使用noisereduce库进行降噪处理。
- 数据切分可以使用audio-slicer库,将训练数据分成小样本以减少内存使用。
- 训练配置文件需要根据具体情况进行调整,特别是batch_size。
- 训练过程中需要监控显存使用,避免出现内存溢出问题。
- 训练完成后,模型存放在指定目录,损失率低于50%表示模型已收敛。
➡️