DataDream:调一调更好,基于LoRA微调SD的训练集合成新方案 | ECCV'24 - 晓飞的算法工程笔记
原文中文,约7200字,阅读约需18分钟。发表于: 。尽管文本到图像的扩散模型已被证明在图像合成方面达到了最先进的结果,但它们尚未证明在下游应用中的有效性。先前的研究提出了在有限的真实数据访问下为图像分类器训练生成数据的方法。然而,这些方法在生成内部分布图像或描绘细粒度特征方面存在困难,从而阻碍了在合成数据集上训练的分类模型的泛化能力。论文提出了Dat
DataDream 提出了一种新方法,通过微调生成模型的 LoRA 权重,用少量真实数据生成更真实的合成数据集,提高了分类准确率。实验显示,该方法在多个数据集上优于现有方法,并分析了真实与合成数据数量对性能的影响。