理解 Stable Diffusion UNet 网络
原文中文,约3500字,阅读约需9分钟。发表于: 。在前面的学习中,我们把 SD UNet 网络当成黑盒,不太影响对图片生成大致原理的理解,但在继续学 SD 的过 […]
SD UNet是基于UNet网络的改进版本,引入了ControlNet、T2I-Adapter和IPAdapter等技术。通过添加ResnetBlock和Transformer模块,SD UNet实现了基于文本条件的图像生成。Transformer模块包括自注意力和交叉注意力,用于捕捉图片特征和融合文本特征。整个网络架构通过这些模块的叠加来构建。