使用256张图像在FLUX上进行自我训练 - 结果令人震惊

💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

本文介绍了作者使用Flux LoRA进行训练的工作流程,包括使用Poco X6相机手机拍摄图像、使用Clip-L和T5-XXL文本编码器进行训练,以及使用自己开发的SUPIR应用程序进行批量放大和自动LLaVA字幕改进。作者发现使用256张图像进行训练会导致过拟合问题,但FLUX在处理这个数据集时表现出色。最后,作者指出数据集收集时间的不同导致了推理时的一些不一致问题。

🎯

关键要点

  • 作者使用Poco X6相机手机拍摄图像进行训练。
  • 使用Clip-L和T5-XXL文本编码器进行训练。
  • 开发了SUPIR应用程序用于批量放大和自动LLaVA字幕改进。
  • 使用256张图像进行训练导致过拟合问题。
  • FLUX在处理数据集时表现出色。
  • 数据集收集时间不同导致推理时不一致问题。
➡️

继续阅读