Text-to-Image Diffusion Models Struggle with Counting, and Prompt Optimization is Ineffective
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了T2ICountBench基准,用于评估文本到图像生成模型的计数能力。研究发现,现有模型在生成物体数量时表现不佳,尤其在数量较多时准确率显著下降。
🎯
关键要点
-
本研究提出了T2ICountBench基准,用于评估文本到图像生成模型的计数能力。
-
现有模型在生成物体数量时表现不佳,尤其在数量较多时准确率显著下降。
-
研究解决了文本到图像生成模型在遵循数字约束方面的基本局限性。
-
所有模型在生成正确物体数量时均表现不佳,特别是在物体数量较多时。
➡️