使用单个图像对定制文本到图像模型
原文中文,约500字,阅读约需2分钟。发表于: 。通过一对图像的样式差异来定制生成模型,我们提出了一种名为 “Pair Customization” 的方法,能够捕捉到样式差异并将其应用于生成过程,以实现对样式的定制化。这种方法能够避免对样例中特定图像内容的过度拟合,通过将样式和内容分割为不同的权重空间,并在优化过程中鼓励它们的正交性。实验结果表明,我们的方法能够有效学习样式而不过拟合图像内容,展示了通过单个图像对建模样式差异的潜力。
最近的文本到图像生成模型擅长模仿受版权保护的内容,引起艺术家担忧。本文重新定义“艺术版权侵权”为对图像集进行分类问题,并介绍了ArtSavant工具。该工具通过与372位艺术家作品组成的参考数据集比较,确定艺术家独特风格,并识别其是否出现在生成的图像中。实证研究揭示了三种流行的文本到图像生成模型中艺术风格被复制的普遍情况。在大量艺术家数据集中,仅有20%的艺术家风格有被复制的风险。