清华大学与生数科技合作开发了音频超分辨率模型AudioLBM,能够将低采样率音频提升至192 kHz,显著改善音质。该模型基于桥类生成模型,采用隐空间建模,提升了音频生成的效率与质量,推动了音频超分领域的发展。
本研究提出FLowHigh方法,针对音频超分辨率中的病态问题,应用高效生成模型流匹配技术,显著提升重建质量。实验结果表明,FLowHigh在VCTK基准数据集上表现优异,仅需单步采样,降低计算延迟。
完成下面两步后,将自动完成登录并继续当前操作。