FlowMAC:基于条件流匹配的低比特率音频编码
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了FlowMAC,一种新颖的神经音频编解码器,针对低比特率下高质量的通用音频压缩。这一研究首次将条件流匹配应用于通用音频编码,实现了可扩展和内存高效的训练,FlowMAC在3 kbps下的主观评价显示其音质与双倍比特率下的先进GAN和DDPM音频编解码器相媲美,且其可调的推理管道支持复杂度与质量的权衡,能够在CPU上实现实时编码。
本文介绍了FlowMAC,这是一种创新的神经音频编解码器,专注于在低比特率下实现高质量音频压缩。它首次将条件流匹配用于音频编码,实现高效训练。在3 kbps下,FlowMAC的音质可媲美更高比特率的编解码器,并支持在复杂度与质量之间灵活平衡,可在CPU上实时运行。