在扩散模型中检测、解释和减轻记忆化
原文中文,约400字,阅读约需1分钟。发表于: 。我们介绍了一种简单而有效的方法,通过检查文本条件预测的量级来检测记忆的提示,建立在我们的检测策略之上,我们揭示了一种可解释的方法,显示了个别词或令牌对记忆的贡献,我们还提出了两种策略,即通过利用文本条件预测的量级来减少记忆的影响,无论是在推理过程中进行最小化还是在训练过程中进行筛选,这些提出的策略有效地抵消记忆的影响,同时保持高生成质量。
最近的研究发现,文本到图像扩散模型在生成高质量图像方面表现出色,但也引发了对版权侵权和隐私风险的担忧。研究人员通过检查交叉注意力机制与记忆现象的关系,提出了一种新的视角来理解这一现象。他们发现,交叉注意力倾向于过度关注特定标记的嵌入,导致模型过度拟合并记住了训练图像。为了解决这个问题,他们提出了一种创新方法来检测和减轻扩散模型中的记忆现象,同时保持生成图像质量不受影响。