💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
Stable-Diffusion-Xl-Base-1.0是Stability AI开发的文本生成图像模型,利用预训练的文本编码器,根据文本提示生成和修改图像,可独立使用或作为两阶段管道的一部分。
🎯
关键要点
- Stable-Diffusion-Xl-Base-1.0是由Stability AI开发的文本生成图像模型。
- 该模型是一个潜在扩散模型,使用两个固定的预训练文本编码器:OpenCLIP-ViT/G和CLIP-ViT/L。
- 模型可以根据文本提示生成和修改图像,既可以独立使用,也可以作为两阶段管道的一部分。
- 类似的模型包括oot_diffusion_dc、kandinsky-2和pixart-sigma。
- 模型输入为文本提示,输出为生成的图像。
- 输入示例为描述所需图像的文本,如'美丽的日落在山景上'。
- 输出为与输入文本提示相对应的生成图像。
➡️