面部生成的可控语义潜在扩散模型

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种基于新型潜在扩散模型结构的人脸生成和编辑的语义图像合成框架。该框架使用了SPADE归一化和交叉注意力层,能够精确控制人脸的每个语义部分,实现对真实参考图像的重现、操纵和多样化生成。实验证明,该框架在质量和数量上优于现有技术。

🎯

关键要点

  • 文章介绍了一种基于新型潜在扩散模型结构的人脸生成和编辑的语义图像合成框架。
  • 该框架使用SPADE归一化和交叉注意力层,能够精确控制人脸的每个语义部分。
  • 框架实现了对真实参考图像的重现、操纵和多样化生成。
  • 实验证明该框架在质量和数量上优于现有技术。
➡️

继续阅读