刘悦 ·

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

💡 原文中文，约17300字，阅读约需42分钟。

📝

内容提要

本文介绍了如何构建训练集、进行数据清洗和切分。训练集需要选择具有歌手音色特质的歌曲，并使用noisereduce库进行降噪处理。数据切分可以使用audio-slicer库，将清唱样本切成小样本。最后，给出了训练配置文件，并介绍了如何进行训练。

🎯

关键要点

构建训练集需要选择具有歌手音色特质的歌曲。
训练集的作用是为模型提供学习材料，通过反复迭代优化模型。
训练集数据贵精不贵多，特征权重高的清晰样本效果更好。
训练集的数量和质量都很重要，需要进行数据清洗和增强。
数据清洗包括去掉伴奏、停顿和混音部分，只保留清唱版本。
使用spleeter库进行伴奏和人声分离，使用noisereduce库进行降噪处理。
数据切分可以使用audio-slicer库，将训练数据分成小样本以减少内存使用。
训练配置文件需要根据具体情况进行调整，特别是batch_size。
训练过程中需要监控显存使用，避免出现内存溢出问题。
训练完成后，模型存放在指定目录，损失率低于50%表示模型已收敛。

🏷️

标签

ai 人工智能数据切分数据清洗训练配置文件训练集降噪处理

➡️

继续阅读

不换模型，效果提升104%！上海AI Lab让Harness也能自进化了
Harness本身也可以被搜索、验证和迭代
【Rust日报】2026-07-20 Keel 0.3 发布：Rust 写的静态类型解释语言补上标准库、Map 和文档站
Keel 0.3 发布：Rust 写的静态类型解释语言补上标准库、Map 和文档站 Keel 0.3 这次更新挺像一个“从实验玩具往可用语言继续推进”的节...
拼装取代生成：这个开源工具用115个原子元件终结AI低效编码
115个软件元素一次拼装就够，为什么还要让大模型每次从零生成代码？一个叫Software Periodic Table的开源项目把常用软件模块像化学元素...
J-Space启发：Hermespace给Hermes搞了个永不遗忘的记忆库
62颗星的开源项目，凭什么敢说自己是AI的永存记忆库，这不比人类记性还狠？ Hermespace给AI搞了个永不删除的记忆库，每次对话、每个决策、每条信念...
AI 内存别只当概念看：它其实是状态管理问题
阮一峰周刊提到 AI 内存这个话题。比起把它看成模型能力，我更关心它在真实系统里的状态管理、隔离、回滚和观测问题。AI 应用想记住用户，先要能解释、能删除、能排查。
Claude Code换上了AI 11天重写的Rust版Bun
Claude Code悄悄把底层运行时从Zig版Bun换成了Rust版，启动快了10%但根本没人察觉。这次静默升级背后，藏着AI重写整个代码库、供应链收...