Apple Machine Learning Research ·

屏蔽扩散：利用稀疏排斥生成新颖多样的图像

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

本文探讨了扩散模型生成图像的多样性问题，提出了一种通过引入数据驱动的排斥项来增强生成图像多样性和质量的方法。该方法在批量生成相同提示的图像时表现优异，同时保护特定图像集的多样性。

🎯

🔎

扩散模型在生成图像时，常常面临重复生成相同提示导致的多样性不足问题。这种现象限制了模型在创意任务中的应用，影响了其实际价值。了解这一挑战有助于研究人员和开发者在设计生成模型时，考虑如何引入更多的多样性元素。

本文提出的通过引入数据驱动的排斥项来增强生成图像多样性的方法，能够有效提高生成图像的质量和多样性。这种方法不仅在批量生成时表现优异，还能在保护特定图像集的同时，确保生成图像的独特性，具有广泛的应用潜力。

使用广泛相似图像的数据集作为参考集，可以在生成图像的精度与多样性之间进行有效的权衡。这一策略为图像生成提供了新的思路，尤其是在需要保持一定质量标准的情况下，如何平衡多样性与精确度将是未来研究的重要方向。

❓

扩散模型在重复生成相同提示时，通常只会得到轻微变化的相同模式，导致缺乏内在多样性。

本文提出了一种通过引入数据驱动的排斥项来增强生成图像多样性和质量的方法。

该方法在批量生成相同提示的图像时，能够提高多样性和FID（Fréchet Inception Distance）。

使用广泛相似图像的数据集作为参考集，可以在精度与多样性之间进行权衡。

该方法能够确保生成的图像与受保护的参考图像集保持足够的距离，而无需丢弃生成的图像。

本文的研究领域包括计算机视觉和方法与算法。

🏷️