亚马逊AWS官方博客 ·

Stable Diffusion Quick Kit 动手实践 – 使用 Stable Diffusion XL 和 SDXL LoRA，ControlNet 生成图片

💡 原文中文，约7700字，阅读约需19分钟。

📝

内容提要

本文介绍了 Stable Diffusion XL（SDXL）模型的概述和基础架构，以及如何在 HuggingFace diffusers 中使用 SDXL 和适用于 SDXL 的 Lora 模型和 ControlNet 模型进行推理。文章还提供了代码示例和测试方法。

🎯

Stable Diffusion Quick Kit 是一个快速部署工具包，包含示例代码和服务部署脚本。
Stable Diffusion XL（SDXL）是由 Stability AI 创建的新图片生成模型，优化了 U-Net、VAE 和 CLIP Text Encode。
SDXL 引入了 Refiner 模型，提升生成图像的精细程度。
SDXL 是一个二阶段级联扩散模型，由 Base 模型和 Refiner 模型组成，旨在提高图像质量和细节。
SDXL 的 UNet 参数数量为 2.6B，显著高于之前的模型。
Refiner 模型在推理阶段对生成的图像进行去噪，提升整体质量与局部细节。
在 HuggingFace diffusers 中使用 SDXL 需要版本 v0.19.3 或以上，提供了新的 Pipeline 接口。
Quick Kit 支持动态加载 SDXL 和 LoRA 模型，提供了 Canny 和 Depth 两个 ControlNet 模型。
在 SageMaker Notebook 中创建推理服务需要设置推理参数和机器类型。
SDXL LoRA 模型与之前的 SD 1.5 LoRA 模型不兼容，需要使用专门训练的 LoRA 模型。
测试 SDXL 时可以选择使用或不使用 Refiner 模型，支持动态加载 ControlNet 模型。
目前 diffusers 社区在快速发展，但仍有一些功能在开发中，如不支持多个 LoRA 加载。

🏷️