多模态条件下的三维感知图像生成和编辑
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种新颖的端到端 3D 感知图像生成和编辑模型,通过纯噪声、文本和参考图像等多种条件输入,在 3D 生成对抗网络(GANs)的潜在空间中深入研究并提出解缠特性较好的生成策略,同时采用统一框架进行灵活的图像生成和编辑任务,实现多模态条件下的多样图像生成、属性编辑和风格迁移。广泛实验证明,该方法在图像生成和编辑方面在质量和数量上均优于替代方法。
本文提出了一种新颖的端到端3D感知图像生成和编辑模型,通过多种条件输入,在3D生成对抗网络的潜在空间中研究生成策略,实现多样图像生成、属性编辑和风格迁移。实验证明该方法在质量和数量上优于替代方法。