本研究探讨了在缺乏成对输入输出信号的情况下,如何准确估计非线性音频效果。提出了一种基于扩散生成模型的新方法,并与对抗方法进行了比较。实验结果表明,扩散方法在数据可用性上更为稳定,而对抗方法在估计明显失真效果方面表现更佳,显示了扩散模型在音乐技术中的潜力。
该文介绍了一种基于单一框架统一 Optimal Transport(OT)的对抗方法,通过全面分析框架的组成部分来阐明其在训练动力学中的作用。该方法在 CIFAR-10 上实现了 2.51 的 FID 得分,胜过了统一的基于 OT 的对抗方法。
完成下面两步后,将自动完成登录并继续当前操作。