本研究介绍了HQ-Edit,一个包含约200,000个编辑的高质量基于指令的图像编辑数据集。使用GPT-4V和DALL-E 3构建了可扩展的数据收集流程,并创建了具有详细文本提示的高质量双联图像。通过GPT-4V对图像编辑对的质量进行定量评估,HQ-Edit的高分辨率图像和全面编辑提示大大增强了现有图像编辑模型的能力。
完成下面两步后,将自动完成登录并继续当前操作。