CLIPtone: 基于无监督学习的文本图像调色
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
TextCLIP是一个用于无对抗训练的文本引导的图像生成和操作的统一框架,结合了CLIP的文本图像表示能力和StyleGAN的生成能力。在CelebA-HQ数据集上,TextCLIP生成的高分辨率图像表现优于现有方法。
🎯
关键要点
- 提出了TextCLIP,这是一个统一的框架。
- TextCLIP用于无对抗训练的文本引导的图像生成和操作。
- 结合了CLIP的文本图像表示能力和StyleGAN的生成能力。
- 能够生成高达1024×1024分辨率的图像。
- 在Multi-modal CelebA-HQ数据集上表现优于现有最先进方法。
➡️