微软的DelightfulTTS是一种端到端神经文本语音合成系统,用于Blizzard Challenge 2021。该系统通过直接建模和生成48 kHz采样率的波形,以及系统化设计来建模语音中的变化信息,实现了自然且高质量的语音合成。
完成下面两步后,将自动完成登录并继续当前操作。