该文介绍了一种利用神经网络驱动的语音合成系统,通过CUC-VAE S2框架实现了上下文敏感的韵律特征生成和模拟人类语音韵律生成的实现方式。该系统解决了表达性语音和无缝编辑的问题,并在文本转语音和语音编辑两个方面提出了实用的算法,实验证明这些模型显著提升了语音合成和编辑的效果。
完成下面两步后,将自动完成登录并继续当前操作。