💡 原文英文,约300词,阅读约需1分钟。
📝

内容提要

Stable-Diffusion-Xl-Base-1.0是Stability AI开发的文本生成图像模型,利用预训练的文本编码器,根据文本提示生成和修改图像,可独立使用或作为两阶段管道的一部分。

🎯

关键要点

  • Stable-Diffusion-Xl-Base-1.0是由Stability AI开发的文本生成图像模型。
  • 该模型是一个潜在扩散模型,使用两个固定的预训练文本编码器:OpenCLIP-ViT/G和CLIP-ViT/L。
  • 模型可以根据文本提示生成和修改图像,既可以独立使用,也可以作为两阶段管道的一部分。
  • 类似的模型包括oot_diffusion_dc、kandinsky-2和pixart-sigma。
  • 模型输入为文本提示,输出为生成的图像。
  • 输入示例为描述所需图像的文本,如'美丽的日落在山景上'。
  • 输出为与输入文本提示相对应的生成图像。
➡️

继续阅读