本研究提出了DEX-TTS,一种基于扩散的表达性语音合成方法,用于增强语音合成的风格表达能力。DEX-TTS在英语多说话人和情感多说话人数据集上表现出色。
本文介绍了DEX-TTS模型,一种基于扩散的表达性语音合成模型,用于合成自然语音。该模型通过提取参考语音中的风格来增强风格表达能力,并设计了高泛化能力的编码器和适配器。DEX-TTS在多说话人和情感多说话人数据集上取得了出色的性能,无需预训练策略。
完成下面两步后,将自动完成登录并继续当前操作。