Pico-Banana-400K:一个用于文本引导图像编辑的大规模数据集

Pico-Banana-400K:一个用于文本引导图像编辑的大规模数据集

Apple Machine Learning Research Apple Machine Learning Research ·

Pico-Banana-400K是一个包含40万张图像的数据集,专为基于指令的图像编辑设计。它通过Nano-Banana生成多样的编辑对,确保高质量和多样性,支持复杂编辑场景的研究。数据集包括多轮编辑、偏好研究和指令重写等子集,为文本引导的图像编辑模型提供了坚实基础。

原文英文,约200词,阅读约需1分钟。
阅读原文