小红花·文摘

本研究提出了“形象化语言图像识别”数据集，研究了多模态形象化语言的难点，并初步研究了基准任务和基线模型。结果显示，模型在多模态形象化语言理解上不如人类。该数据集和任务将促进模型对形象化语言的理解。