面向对象的图像编辑的反演与重组

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

该文提出了一种新的图像编辑范式,称为对象感知的反转和重组(OIR),以实现基于对象的精细编辑。实验证明,该方法在编辑对象形状、颜色、材料、类别等方面取得了卓越的性能,尤其是在多对象编辑场景中。

🎯

关键要点

  • 提出了一种新的图像编辑范式,称为对象感知的反转和重组(OIR)。
  • OIR方法实现了基于对象的精细编辑,特别是在多对象编辑场景中表现优异。
  • 现有编辑方法依赖固定数量的反转步骤,导致生成质量次优,尤其在处理多个编辑对时。
  • 每个编辑对所需的最佳反转步骤数量因编辑难度不同而显著变化。
  • 设计了一种新的搜索度量,考虑目标的可编辑性和非编辑区域的忠实度,以确定最佳反转步骤。
  • 通过单独编辑每个编辑对,避免概念不匹配。
  • 提出了重组步骤,将编辑结果与非编辑区域无缝集成,获得最终编辑图像。
  • 通过两个数据集进行基准测试,验证了方法的有效性。
➡️

继续阅读