小红花·文摘

DataDream 提出了一种新方法，通过微调生成模型的 LoRA 权重，用少量真实数据生成更真实的合成数据集，提高了分类准确率。实验显示，该方法在多个数据集上优于现有方法，并分析了真实与合成数据数量对性能的影响。

晓飞的算法工程笔记 ·

该论文提出了DreamDA框架，通过扩散模型生成多样样本和伪标签，验证了其在生成高质量图像和准确标签方面的有效性。同时，研究探讨了利用文本到图像模型生成训练数据的方法，显示出在多个任务中显著提升分类器性能的潜力。

BriefGPT - AI 论文速递 ·