使用256张图像在FLUX上进行自我训练 - 结果令人震惊
💡
原文英文,约500词,阅读约需2分钟。
📝
内容提要
本文介绍了作者使用Flux LoRA进行训练的工作流程,包括使用Poco X6相机手机拍摄图像、使用Clip-L和T5-XXL文本编码器进行训练,以及使用自己开发的SUPIR应用程序进行批量放大和自动LLaVA字幕改进。作者发现使用256张图像进行训练会导致过拟合问题,但FLUX在处理这个数据集时表现出色。最后,作者指出数据集收集时间的不同导致了推理时的一些不一致问题。
🎯
关键要点
- 作者使用Poco X6相机手机拍摄图像进行训练。
- 使用Clip-L和T5-XXL文本编码器进行训练。
- 开发了SUPIR应用程序用于批量放大和自动LLaVA字幕改进。
- 使用256张图像进行训练导致过拟合问题。
- FLUX在处理数据集时表现出色。
- 数据集收集时间不同导致推理时不一致问题。
➡️