CLIPtone: 基于无监督学习的文本图像调色
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
TextCLIP是一个用于无对抗训练的文本引导的图像生成和操作的统一框架,结合了CLIP的文本图像表示能力和StyleGAN的生成能力。在CelebA-HQ数据集上,TextCLIP生成的高分辨率图像表现优于现有方法。
🎯
关键要点
-
提出了TextCLIP,这是一个统一的框架。
-
TextCLIP用于无对抗训练的文本引导的图像生成和操作。
-
结合了CLIP的文本图像表示能力和StyleGAN的生成能力。
-
能够生成高达1024×1024分辨率的图像。
-
在Multi-modal CelebA-HQ数据集上表现优于现有最先进方法。
➡️