本文提出了一种基于普通微分方程的线性扩散模型(LinDiff),用于快速推理和高采样质量。通过补丁处理方法减少计算复杂性和实现嘈杂语音的全局建模。使用对抗性训练改善样本质量,并在条件语音合成中进行测试。实验结果表明,该模型可以合成高质量语音,速度更快。
完成下面两步后,将自动完成登录并继续当前操作。