小红花·文摘

本研究介绍了HQ-Edit数据集，包含约20万个高质量图像编辑。通过GPT-4V和DALL-E 3构建数据收集流程，生成高分辨率图像和详细文本提示。提出的评估指标Alignment和Coherence用于定量评估图像编辑质量。SEED-X模型提升了视觉语言理解能力，SmartEdit和iEdit方法在复杂指令下的图像编辑中表现优异，推动了相关领域的研究。