小红花·文摘

本文介绍了一种新的个性化文本到图像模型，通过少量输入图像微调预训练模型，实现高质量图像生成。研究提出了多主题生成的解决方案，利用文本嵌入和布局增强图像-文本对齐效果。同时，介绍了基于文本的图像修复技术，结合文本和示例图像进行修复，确保主题一致性和视觉质量。此外，ConsiStory方法实现了无需训练的主题一致性生成，LAR-Gen则专注于遮挡场景的修复，展现了在身份保护和文本语义一致性方面的优势。

RealCustom++：将图像表示为真实词以实现实时定制

BriefGPT - AI 论文速递 ·

Text-to-image customization using RealCustom disentangles similarity from controllability by limiting subject influence, achieved through a train-inference decoupled framework, resulting in...

RealCustom: 实时开放领域文本到图像定制的实际文本缩窄

BriefGPT - AI 论文速递 ·