本研究提出了一种改进的神经音频编解码器波形再合成方法,探讨了令牌预测与回归策略,并引入新方法,强调学习目标对音频质量的重要性。
本研究使用神经音频编解码器EnCodec生成音频,并学习通用音频模型EncodecMAE,取得了与领先的音频表示模型相媲美或更好的性能。
完成下面两步后,将自动完成登录并继续当前操作。