基于视觉问答的文本到图像生成评估指标
发表于: 。本研究针对文本到图像生成领域现有评估方法存在的局限性,提出了新的评估指标,能够更准确地评估输入文本与生成图像之间的逐个对象对齐情况。通过利用chatGPT生成与图像相关的问题,并采用视觉问答技术来衡量其相关性,实验结果表明,该方法在细致评估文本与图像对齐及图像质量方面表现优越,具有重要的应用潜力。
本研究针对文本到图像生成领域现有评估方法存在的局限性,提出了新的评估指标,能够更准确地评估输入文本与生成图像之间的逐个对象对齐情况。通过利用chatGPT生成与图像相关的问题,并采用视觉问答技术来衡量其相关性,实验结果表明,该方法在细致评估文本与图像对齐及图像质量方面表现优越,具有重要的应用潜力。