小红花·文摘

该研究介绍了一种用于提升视觉幽默理解能力的图像数据集，并通过评估幽默性进行量化。研究展示了视觉语言模型的有希望结果，并将该数据集作为大型多模态模型的零样本基准。