小红花·文摘

DEV Community ·

本研究提出了Paralinguistic Speech Captions（ParaSpeechCaps）数据集，解决了大规模语音数据集风格标签不足的问题。通过结合多种文本与语音嵌入技术，自动扩展了59种风格标签的数据集。微调TTS模型后，语音风格一致性和自然度显著提高，展示了研究的潜在影响。

BriefGPT - AI 论文速递 ·