面部生成的可控语义潜在扩散模型
原文中文,约300字,阅读约需1分钟。发表于: 。基于新型潜在扩散模型结构的人脸生成和编辑的语义图像合成(SIS)框架,通过使用 SPADE 归一化和交叉注意力层合并形状和样式信息,允许对人脸的每个语义部分进行精确控制,从而实现对真实参考图像的重现、操纵和多样化生成的建议系统优于现有的最先进技术,经过广泛的实验验证了其在质量和数量上的优越性。
该文章介绍了一种基于新型潜在扩散模型结构的人脸生成和编辑的语义图像合成框架。该框架使用了SPADE归一化和交叉注意力层,能够精确控制人脸的每个语义部分,实现对真实参考图像的重现、操纵和多样化生成。实验证明,该框架在质量和数量上优于现有技术。