MIGC: 文本到图像合成的多实例生成控制器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们提出了一个多实例生成任务(MIG),通过创新方法MIGC,能够在一幅图像中生成具有多样控制的多个实例。实验结果显示,我们的模型在数量、位置、属性和交互方面具有优异的控制能力。
🎯
关键要点
- 提出了一个多实例生成任务(MIG)。
- MIG任务能够在一幅图像中生成多个具有多样控制的实例。
- 通过将MIG任务分解为子任务,引入了创新方法MIGC。
- 利用实例增强的注意力机制精确阴影每个实例并聚合它们。
- 在COCO-MIG基准上进行了广泛实验。
- 实验结果显示模型在数量、位置、属性和交互方面具有优异的控制能力。
🏷️
标签
➡️