BriefGPT - AI 论文速递 ·

HQ-Edit：面向基于指令的图像编辑的高质量数据集

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文介绍了一种基于用户书面指令的图像编辑方法，结合预训练模型生成训练数据，研究了多个数据集，推动了文本引导和区域编辑检测的研究，提出了新框架和算法，提升了图像编辑的性能和用户体验。

🎯

❓

HQ-Edit的主要目标是根据用户书面指令进行图像编辑，并结合预训练模型生成训练数据。

HQ-Edit使用了包括14,905个人工编辑版本和2,981个机器生成视觉故事的数据集，以及WikiIns和SJTU-H3D等多个新数据集。

iEdit学习方法包括数据集的自动构建和无监督损失函数，显示出在图像保真度和编辑生成方面的优越效果。

MagicBrush是第一个大规模手动注释的指令引导真实图像编辑数据集，展示了当前算法与真实世界需求的差距。

GRE数据集旨在推动生成区域编辑检测领域的研究，包含多种编辑方式的原始图片。

通过建立高质量的WikiIns数据集，利用众包验证和自动生成训练集的方法来实现自然语言指令的受控文本编辑。

🏷️