面向对象的图像编辑的反演与重组
原文中文,约700字,阅读约需2分钟。发表于: 。通过对比编辑任务中的原始提示和目标提示,我们可以获得众多编辑对,每个对包含一个对象及其相应的编辑目标。为了在保持对输入图像的忠实度的同时允许可编辑性,现有的编辑方法通常涉及固定数量的反转步骤,将整个输入图像投射到其更嘈杂的潜在表示,然后由目标提示指导的去噪过程。然而,我们发现每个编辑对实现理想的编辑结果所需的最佳反转步骤数量在不同编辑对之间存在显著变化,这是由于编辑难度的不同造成的。因此,当...
该文提出了一种新的图像编辑范式,称为对象感知的反转和重组(OIR),以实现基于对象的精细编辑。实验证明,该方法在编辑对象形状、颜色、材料、类别等方面取得了卓越的性能,尤其是在多对象编辑场景中。