MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models in Human Emotion Analysis

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了MEMO-Bench基准,包含7145幅肖像,旨在评估文本到图像模型和多模态大型语言模型在情感分析中的能力。结果显示,现有模型在生成积极情感方面表现较好,但在细粒度情感识别上仍与人类准确性存在差距。该基准将公开发布以促进研究。

🎯

关键要点

  • 本研究提出了MEMO-Bench基准,包含7145幅肖像,旨在评估文本到图像模型和多模态大型语言模型在情感分析中的能力。
  • 研究发现,现有的文本到图像模型在生成积极情感方面表现较好。
  • 多模态大型语言模型在情感识别方面的表现有限,尤其是在细粒度情感分析中,距离人类的准确性仍有差距。
  • 该基准将公开发布,以促进进一步研究。
➡️

继续阅读