用非可微分规则引导扩散进行符号音乐生成

原文约100字,阅读约需1分钟。发表于:

我们研究了符号音乐生成中的非可微分规则引导问题,提出了一种名为 Stochastic Control Guidance (SCG) 的新型引导方法,以插拔方式与预训练的扩散模型结合使用,实现了对非可微分规则的无训练引导。我们还引入了具有高时间分辨率的潜在扩散架构,可与 SCG 以插拔方式相结合。与符号音乐生成的标准基线相比,该框架在音乐质量和基于规则的控制性能方面表现出明显的进步,优于当前各种场景下的最先进生成器。

研究者提出了一种名为Stochastic Control Guidance (SCG)的新型引导方法,用于符号音乐生成中的非可微分规则引导问题。他们还引入了具有高时间分辨率的潜在扩散架构,与SCG相结合。该框架在音乐质量和基于规则的控制性能方面表现出明显的进步,优于当前最先进的生成器。

相关推荐 去reddit讨论