Sekyoro的博客小屋 ·

Dive into fine-tuning methods for SD

💡 原文中文，约5600字，阅读约需14分钟。

📝

内容提要

文生图和图生图技术发展了多种微调方法，如Textual Inversion和DreamBooth。LoRA技术通过调整计算模块提高微调效率，结合不同方法可获得更佳效果。尽管新概念和个性化生成面临挑战，但优化嵌入向量可以解决这些问题。

🎯

🔎

随着文生图和图生图技术的发展，微调方法也在不断演变。从Textual Inversion到DreamBooth，再到LoRA，每种方法都有其独特的优势和应用场景。了解这些技术的演变有助于用户选择最适合其需求的微调方案，尤其是在个性化生成方面。

LoRA技术通过低秩分解更新权重，显著提高了微调效率。这种方法不仅缩短了训练周期，还能与其他微调方法结合使用，进一步提升生成效果。用户在选择微调技术时，应关注LoRA的灵活性和高效性，尤其是在处理复杂任务时。

在微调过程中，将新概念引入模型常常面临灾难性遗忘的问题。Textual Inversion通过新的词嵌入表示来解决这一挑战，而DreamBooth则通过稀有标记标识符增强生成能力。用户在使用这些技术时，应注意如何有效地管理已有知识与新概念之间的平衡。

❓

Textual Inversion是一种通过新的词嵌入表示独特概念的微调方法，旨在解决将新概念引入模型的困难。

LoRA通过修改计算模块和低秩分解更新权重，缩短微调过程和训练周期，从而提高微调效率。

DreamBooth通过稀有标记标识符将主体植入模型输出域，并对模型进行微调，而Textual Inversion主要关注词嵌入的学习。

使用LoRA进行微调时，冻结预训练模型，并训练一个包含可训练参数的模块，以更新权重。

LyCORIS提出了一系列基于LoRA的微调方式，并设计了benchmark测试，包括LoHA和LoKr等方法。

InstantID通过人脸编码器实现零-shot身份保持生成，允许用户生成高保真度的ID保持图像，无需文本信息。

🏷️