GeoDiffuser:基于几何的扩散模型图像编辑

原文约300字,阅读约需1分钟。发表于:

GeoDiffuser 是一种优化为基础的方法,将常见的二维和三维基于图像的对象编辑功能统一为单一方法,通过将图像编辑操作视为几何变换,并将其直接合并到扩散模型的注意力层中隐式执行编辑操作,以实现保持对象风格并生成合理图像的目标函数进行训练 - free 优化方法。

RenderDiffusion是一个用于3D生成和推断的扩散模型,使用单眼2D监督进行训练,并采用新颖的图像去噪架构来提供中间的三维表示。该模型在多个数据集上评估,展示了生成和推理3D场景的竞争性表现。此外,该方法还可以使用2D修复来编辑3D场景。

相关推荐 去reddit讨论