SEED-Data-Edit 技术报告:用于教学图像编辑的混合数据集
原文中文,约400字,阅读约需1分钟。发表于: 。SEED-Data-Edit 是一个用于指导图像编辑的独特混合数据集,包括高质量编辑数据、实际场景数据、和多轮编辑数据;使用该数据集对预训练的多模态大型语言模型进行微调,显示了其在指导图像编辑方面的潜力和有效性。
本研究介绍了HQ-Edit数据集,包含约200,000个高质量编辑的图像,使用GPT-4V和DALL-E 3模型收集在线示例并创建高质量双联图像。提出了Alignment和Coherence两个评估指标,并使用GPT-4V对图像编辑对的质量进行定量评估。HQ-Edit的高分辨率图像和全面编辑提示增强了现有图像编辑模型的能力,微调的InstructPix2Pix达到了最先进的图像编辑性能。