渐进式提示细化以改善文本到图像生成模型的对齐性

📝

内容提要

本研究解决了文本到图像生成模型在处理复杂场景和多样化物体时的对齐问题。提出的SCoPE方法通过将输入提示逐步细化,从粗略到精细地改进对齐效果,显著提升了生成图像的质量,针对GenAI-Bench数据集的结果显示,平均改善了视觉问答得分达4%。

➡️

继续阅读