BriefGPT - AI 论文速递 ·

促进的歌唱声音合成：通过自然语言提示实现可控

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文介绍了新型多歌手中文神经唱歌声合成系统WeSinger，该系统采用24 kHz LPCNet和多歌手预训练，显著提升了合成歌声的准确性和自然度。在公共中文唱歌语料库Opencpop上表现优异，展示了高质量歌声合成的潜力。

🎯

❓

WeSinger是一种多歌手中文神经唱歌声合成系统，采用24 kHz LPCNet和多歌手预训练，显著提高了合成歌声的准确性和自然度。

WeSinger在公共中文唱歌语料库Opencpop上表现优异，取得了最先进的性能。

WeSinger通过定制模块和技术，以及旋律无监督多说话人预训练方法，提高了合成歌声的音质和节奏自然度。

预训练方法提高了单个说话人的声域，同时不降低音色相似性，适用于大规模多歌手数据集。

WeSinger通过单一模型和自然语言条件实现高保真度的语音生成，适应多种口音和声学条件。

WeSinger展示了高质量歌声合成的潜力，适用于音乐创作和多媒体应用。

🏷️