CVQA是一个新的多元文化多语言视觉问答基准,覆盖了28个国家的文化驱动图像和问题。基准测试显示该数据集对当前最先进的多模态模型具有挑战性,可以评估模型的文化能力和偏见,并鼓励增加文化意识和语言多样性的研究努力。
完成下面两步后,将自动完成登录并继续当前操作。