Idea2Img:基于 GPT-4V(ision)的迭代自我优化的自动图像设计与生成

原文约500字,阅读约需2分钟。发表于:

引入了 “Idea to Image” 系统,利用 GPT-4V (Vision) 进行多模态迭代自我精炼,实现自动图像设计与生成。

本研究通过与DALLE3集成的T2I模型ChatGPT重新审视现有的T2I系统,并引入新的任务——交互式文本到图像(iT2I)。我们提出了一种简单的方法来增强LLMs在iT2I上的能力,并在不同的LLMs下在多种常见场景中评估了我们的方法。

相关推荐 去reddit讨论