苹果发布Pico-Banana-400K数据集以推动文本引导的图像编辑

苹果发布Pico-Banana-400K数据集以推动文本引导的图像编辑

InfoQ InfoQ ·

Pico-Banana-400K是苹果研究人员开发的40万张图像数据集,旨在促进文本引导的图像编辑模型的创建。该数据集通过Nano-Banana修改真实照片,并使用Gemini-2.5-Pro进行质量筛选,填补了高质量可共享图像编辑数据集的空白,支持多种编辑类型的研究与训练。

原文英文,约500词,阅读约需2分钟。
阅读原文