在扩散模型中探索低维子空间以实现可控图像编辑
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对扩散模型语义空间理解不足的问题,提出了一种新的无监督、单步的低秩可控图像编辑方法(LOCO Edit)。通过发现学习的后验均值预测器在特定噪声水平范围内的局部线性特性和雅可比矩阵的奇异向量位于低维语义子空间,LOCO Edit实现在扩散模型中的精确本地编辑,展现了良好的可组合性和转移性。实验结果表明该方法在多个文本到图像扩散模型中的有效性和效率。
本研究提出了一种新的无监督、单步的低秩可控图像编辑方法(LOCO Edit),解决了扩散模型语义空间理解不足的问题。实验证明该方法在多个文本到图像扩散模型中有效且高效。