本文介绍了MagiCodec,一种高性能的单层流式音频编解码器。通过高斯噪声注入和三阶段训练,MagiCodec在保持高保真重建的同时,提升了token的语义可建模性。实验结果表明,其在重建质量和下游任务上均超越现有技术,且token分布符合齐普夫定律,适合音频语言模型。
完成下面两步后,将自动完成登录并继续当前操作。