定位,分配,细化:通过文本主题引导驯服定制图像修复
原文中文,约300字,阅读约需1分钟。发表于: 。LAR-Gen 是一种图像修复方法,可以无缝地修复遮挡的场景图像,结合了文本提示和指定主题,通过粗到细的方式保证主题身份保持和本地语义一致性,并引入了一种新的数据构建流程来解决稀缺训练数据的问题,广泛的实验和各种应用场景展示了 LAR-Gen 在保持身份和文本语义一致性方面的优越性。
本研究介绍了一种新颖的任务,即基于文本导向的主题驱动图像修复。通过DreamInpainter的两步法,准确复制主题并消除多余细节,保留主题身份。实验证明了该方法在质量、身份保护和文本控制方面的卓越性能。