开关扩散变压器:用稀疏专家混合协同降噪任务
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入 Switch Diffusion Transformer (Switch-DiT) 模型,建立冲突任务之间的相互关系,保留语义信息,同时通过稀疏专家集合在每个转换器块中的参数隔离,实现了改进扩散模型架构的目标。通过实验证实了该方法在提高图像质量和收敛速度方面的有效性,并进一步分析表明 Switch-DiT 模型可以根据不同的生成场景构建定制的降噪路径。
扩散模型在图像合成等任务中表现出色,但存在表达瓶颈和过强的假设。提出了一种简单高效的反向去噪模型,能良好逼近高斯混合分布。实验证明该模型在少量反向迭代的情况下显著改进了扩散模型。