本研究提出音频评分蒸馏采样(Audio-SDS),旨在解决音频生成领域缺乏通用模型的问题。Audio-SDS 能够实现多种音频处理任务,如物理音效模拟和源分离,展示了蒸馏方法的广泛适用性。
本研究探讨了室外环境下的基于距离的源分离(DSS),提出了一种结合两阶段conformer block和线性关系感知自注意力(RSA)的模型,显著提高了移动设备的能源效率和实时推断速度。
神经音频编解码器通过将音频信号转换为离散标记来提高压缩率,但难以区分音频域。为解决此问题,研究小组推出了SD-Codec,结合源分离和音频编码,提升音频再合成质量。实验显示,SD-Codec在源分离和重建方面表现优异。
完成下面两步后,将自动完成登录并继续当前操作。