生成数据是否总是有助于对比学习?
原文约200字/词,阅读约需1分钟。发表于: 。逆变学习作为无监督视觉表示学习中最成功的方法之一,依赖于大量的手动数据增强。然而,本文研究发现由扩散模型生成的数据有时会对对比学习产生负面影响,并提出了一种数据为中心的策略,即自适应扩增 (AdaInf),无需额外的计算成本,可在各种对比学习方法上取得显著的改进。
本文评估了扩散模型生成图像的方法,并研究了新的扩展方式对数据增强的益处。研究发现,个性化扩散模型到目标数据的方法优于简单的提示策略,但使用扩散模型的训练数据可以直接提高下游性能。研究揭示了扩散模型在数据增强方面的局限性,同时也突显了其在生成新训练数据方面的潜力,以提高下游视觉任务的性能。