MIGC: 文本到图像合成的多实例生成控制器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

我们提出了一个多实例生成任务(MIG),通过创新方法MIGC,能够在一幅图像中生成具有多样控制的多个实例。实验结果显示,我们的模型在数量、位置、属性和交互方面具有优异的控制能力。

🎯

关键要点

  • 提出了一个多实例生成任务(MIG)。
  • MIG任务能够在一幅图像中生成多个具有多样控制的实例。
  • 通过将MIG任务分解为子任务,引入了创新方法MIGC。
  • 利用实例增强的注意力机制精确阴影每个实例并聚合它们。
  • 在COCO-MIG基准上进行了广泛实验。
  • 实验结果显示模型在数量、位置、属性和交互方面具有优异的控制能力。
🏷️

标签

➡️

继续阅读