DataDream 提出了一种新方法,通过微调生成模型的 LoRA 权重,用少量真实数据生成更真实的合成数据集,提高了分类准确率。实验显示,该方法在多个数据集上优于现有方法,并分析了真实与合成数据数量对性能的影响。
该论文提出了DreamDA框架,通过扩散模型生成多样样本和伪标签,验证了其在生成高质量图像和准确标签方面的有效性。同时,研究探讨了利用文本到图像模型生成训练数据的方法,显示出在多个任务中显著提升分类器性能的潜力。
完成下面两步后,将自动完成登录并继续当前操作。