该研究介绍了一种用于提升视觉幽默理解能力的图像数据集,并通过评估幽默性进行量化。研究展示了视觉语言模型的有希望结果,并将该数据集作为大型多模态模型的零样本基准。
完成下面两步后,将自动完成登录并继续当前操作。