本文介绍了一种名为FreGrad的扩散基声码器,用于生成逼真的音频。通过离散小波变换将复杂波形分解为子带小波,以帮助FreGrad在简单的特征空间上进行操作。实验结果表明,FreGrad相比基线模型在训练时间、推理速度和模型尺寸方面都有显著的优势。
完成下面两步后,将自动完成登录并继续当前操作。