MoLE:通过低秩专家组合增强以人为中心的文本到图像扩散
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
我们提出了一种新模型Subject-Diffusion,支持个性化图像生成,无需微调,仅需参考图像。构建了7600万图像的数据集,设计了统一框架,融合文本与图像语义,提升生成准确性。实验结果表明,该方法优于其他框架。
🎯
关键要点
- 提出了一种新的开放域个性化图像生成模型Subject-Diffusion。
- 该模型无需微调,仅需一个参考图像即可支持个性化生成。
- 构建了7600万图像的大规模数据集,包含主体检测边界框、分割掩模和文本描述。
- 设计了统一框架,融合文本与图像语义,提升生成准确性。
- 采用注意力控制机制支持多主体生成。
- 实验结果表明,该方法优于其他最先进的框架。
🏷️
标签
➡️