小红花·文摘

本研究提出了MEMO-Bench基准，包含7145幅肖像，旨在评估文本到图像模型和多模态大型语言模型在情感分析中的能力。结果显示，现有模型在生成积极情感方面表现较好，但在细粒度情感识别上仍与人类准确性存在差距。该基准将公开发布以促进研究。