EvalMuse-40K: A Reliable and Fine-Grained Benchmark with Comprehensive Human Annotations for Evaluating Text-to-Image Generation Models
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出EvalMuse-40K基准,解决了文本到图像生成模型评估中小型数据集不足的问题。该基准包含40K个带细粒度人类注释的图像-文本对,提供多样评估方式,并引入两种新评估方法,提升了图像-文本对齐能力的评估效果。
🎯
关键要点
-
本研究提出EvalMuse-40K基准,解决了文本到图像生成模型评估中小型数据集不足的问题。
-
EvalMuse-40K基准包含40K个带细粒度人类注释的图像-文本对。
-
该基准提供多样的评估方式,并引入两种新评估方法。
-
新评估方法显著提升了图像-文本对齐能力的评估效果。
-
该工作为未来的生成模型研究提供了重要参考,促进了文本到图像生成的进展。
🏷️