DEV Community ·

使用256张图像在FLUX上进行自我训练 - 结果令人震惊

Q: FLUX在处理数据集时的表现如何？

FLUX在处理这个数据集时表现出色。

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

本文介绍了作者使用Flux LoRA进行训练的工作流程，包括使用Poco X6相机手机拍摄图像、使用Clip-L和T5-XXL文本编码器进行训练，以及使用自己开发的SUPIR应用程序进行批量放大和自动LLaVA字幕改进。作者发现使用256张图像进行训练会导致过拟合问题，但FLUX在处理这个数据集时表现出色。最后，作者指出数据集收集时间的不同导致了推理时的一些不一致问题。

🎯

关键要点

作者使用Poco X6相机手机拍摄图像进行训练。
使用Clip-L和T5-XXL文本编码器进行训练。
开发了SUPIR应用程序用于批量放大和自动LLaVA字幕改进。
使用256张图像进行训练导致过拟合问题。
FLUX在处理数据集时表现出色。
数据集收集时间不同导致推理时不一致问题。

❓

延伸问答

作者使用了什么设备拍摄图像进行训练？

作者使用了Poco X6相机手机拍摄图像进行训练。

训练过程中使用了哪些文本编码器？

训练过程中使用了Clip-L和T5-XXL文本编码器。

使用256张图像进行训练有什么问题？

使用256张图像进行训练导致了过拟合问题。

FLUX在处理数据集时的表现如何？

FLUX在处理这个数据集时表现出色。

作者开发了什么应用程序用于图像处理？

作者开发了SUPIR应用程序用于批量放大和自动LLaVA字幕改进。

数据集收集时间的不同对推理有什么影响？

数据集收集时间的不同导致了推理时的一些不一致问题。

🏷️