文本增强的空间感知零样本指代图像分割

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种使用文本生成图像的方法,提出了一种零-shot分割指导方法ZestGuide,可以提高图像质量。实验结果表明,ZestGuide的效果更好。

🎯

关键要点

  • 使用文本生成图像的方法显著提高了生成图像建模的状态。

  • 提出了一种零-shot分割指导方法ZestGuide。

  • ZestGuide可以插入预先训练的文本到图像扩散模型中。

  • 实验结果表明,ZestGuide在精准对齐输入分割时提高了图像质量。

  • 在COCO数据集上,ZestGuide的效果优于Paint with Words。

🏷️

标签

➡️

继续阅读