CLIPtone: 基于无监督学习的文本图像调色

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

TextCLIP是一个用于无对抗训练的文本引导的图像生成和操作的统一框架,结合了CLIP的文本图像表示能力和StyleGAN的生成能力。在CelebA-HQ数据集上,TextCLIP生成的高分辨率图像表现优于现有方法。

🎯

关键要点

  • 提出了TextCLIP,这是一个统一的框架。

  • TextCLIP用于无对抗训练的文本引导的图像生成和操作。

  • 结合了CLIP的文本图像表示能力和StyleGAN的生成能力。

  • 能够生成高达1024×1024分辨率的图像。

  • 在Multi-modal CelebA-HQ数据集上表现优于现有最先进方法。

➡️

继续阅读