JEEM:四种阿拉伯方言的视觉语言理解

📝

内容提要

本研究提出了JEEM基准,用于评估视觉语言模型在四个阿拉伯国家(约旦、阿联酋、埃及和摩洛哥)的视觉理解能力。研究发现,主流阿拉伯视觉语言模型在理解视觉内容和生成方言特定文本方面的表现不佳,强调了创建更具包容性的模型和具有文化多样性的评估框架的必要性。

➡️

继续阅读