本文探讨了流匹配模型的得分蒸馏方法,以提高图像生成效率。通过推导,统一了高斯扩散与流匹配,并将得分身份蒸馏(SiD)扩展至预训练的文本到图像流匹配模型。实验结果表明,SiD在不同模型中有效,无需教师微调或架构更改,首次系统性证明了得分蒸馏在文本到图像流匹配模型中的广泛适用性。
流匹配模型在图像、视频及不规则数据(如3D点云和蛋白质结构)生成建模中表现优异。传统方法需分两阶段训练,限制了跨数据域的统一性。INRFlow提出了一种领域无关的方法,直接在环境空间中学习流匹配变换器,实验结果显示其在多种数据类型上表现出色,具有广泛应用潜力。
本研究提出Flow-GRPO方法,首次将在线强化学习应用于流匹配模型,有效提升文本到图像任务的生成准确性和人类偏好对齐效果。
本研究提出了 exttt{Latent-CFM}方法,解决了流匹配模型在高维数据集中的学习效率问题,通过预训练深度潜变量模型整合多模态数据,显著提高生成质量并减少约50%的训练时间。
扩散和流匹配模型在生成性能上表现优异,但采样步骤多,影响推理速度。ReFlow程序通过简化生成轨迹加速采样,但需迭代训练,导致样本质量下降。我们提出七项改进,并在CIFAR10、AFHQv2和FFHQ上进行实验,结合技术后在快速生成中实现了最先进的FID分数。
本研究提出了一种环境空间流变换器(ASFT),旨在简化流匹配模型在不同数据域中的训练过程。实证结果表明,ASFT在处理图像和3D点云等数据模态时表现优异,具有良好的跨域适应能力。
本研究探讨流匹配模型在样本数据子空间中合成样本的能力,提出的正交子空间分解网络(OSDNet)有效分解速度场,确保生成样本在保持接近性和多样性的同时,准确代表样本数据子空间。
完成下面两步后,将自动完成登录并继续当前操作。