本研究提出了“形象化语言图像识别”数据集,研究了多模态形象化语言的难点,并初步研究了基准任务和基线模型。结果显示,模型在多模态形象化语言理解上不如人类。该数据集和任务将促进模型对形象化语言的理解。
完成下面两步后,将自动完成登录并继续当前操作。