反超Nano Banana!OpenAI旗舰图像生成模型上线
内容提要
OpenAI发布了新图像生成模型GPT-Image-1.5,具备更好的指令遵循、精确编辑和细节保留,速度提升4倍。尽管在图像生成和编辑方面表现优异,但在理解世界能力上仍不及Nano Banana,用户反馈存在信息错误。
关键要点
-
OpenAI发布了新图像生成模型GPT-Image-1.5,具备更好的指令遵循、精确编辑和细节保留,速度提升4倍。
-
GPT-Image-1.5在图像生成和编辑方面表现优异,但在理解世界能力上仍不及Nano Banana。
-
新模型在指令遵循和精确编辑方面有显著提升,能够保持光照、构图等要素的一致性。
-
GPT-Image-1.5在文本渲染上进步明显,能够处理更密集的小字号文字。
-
评测显示,GPT-Image-1.5在文本转图像和图像编辑方面均位列第一,但在精细化图像编辑能力上仍未能反超谷歌。
-
该模型将于今日起面向全球所有ChatGPT用户与API用户开放,API成本整体下降20%。
-
尽管模型能力有所提升,但在理解世界方面仍存在问题,用户反馈指出信息错误。
延伸解读
模型能力的实用性提升
GPT-Image-1.5在指令遵循和精确编辑方面的显著提升,使其在实际应用中更具实用性。用户可以更方便地进行图像生成和编辑,尤其是在保持光照和构图一致性方面,这对于需要高质量视觉内容的行业尤为重要。
与Nano Banana的比较
尽管GPT-Image-1.5在图像生成和编辑上表现优异,但在理解世界的能力上仍不及Nano Banana。这意味着在需要准确传达信息的场合,如制作PPT时,用户需谨慎使用,以避免信息错误。
API成本的降低
新模型的API成本整体下降20%,这为开发者和企业提供了更具吸引力的选择。随着成本的降低,更多用户可能会尝试将GPT-Image-1.5应用于商业项目,从而推动图像生成技术的普及。
延伸问答
GPT-Image-1.5相比于前一代模型有哪些主要改进?
GPT-Image-1.5在指令遵循、精确编辑、细节保留和速度上有显著提升,速度提高了4倍。
GPT-Image-1.5的图像生成能力如何?
GPT-Image-1.5在图像生成和编辑方面表现优异,尤其在文本转图像和图像编辑中位列第一。
GPT-Image-1.5的API成本如何变化?
GPT-Image-1.5的API成本整体下降20%,高质量图像约为每千张133美元,低质量图像约为每千张9美元。
用户对GPT-Image-1.5的反馈如何?
用户反馈指出GPT-Image-1.5在理解世界能力上存在问题,信息错误较多。
GPT-Image-1.5在精细化图像编辑方面表现如何?
尽管在图像生成和编辑方面表现优异,但在精细化图像编辑能力上仍未能反超谷歌。
GPT-Image-1.5的指令遵循率是多少?
GPT-Image-1.5的指令遵循率高达90%,在同类产品中处于领先地位。