ACCSAMS:自動將考試文件轉換為盲人和視覺障礙者可接觸的學習資料

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们推出了EXAMS-V,一个新的多学科多模态多语言考试基准,包含20932个跨学科的多项选择题,来自7个语系的11种语言。这个数据集对于先进的视觉-文本模型具有挑战性,突显了作为未来基准的重要性。

🎯

关键要点

  • 推出了EXAMS-V,一个新的多学科多模态多语言考试基准。
  • EXAMS-V包含20932个跨越自然科学、社会科学等学科的多项选择题。
  • 数据集包含多种多模态特征,如文本、图像、表格等。
  • 问题来自7个语系的11种语言,采用多样化的教育体系策划。
  • 解决问题需要复杂的推理和对多种语言及地域特定知识的理解。
  • 评估结果显示即使是先进的视觉-文本模型也面临挑战,凸显数据集的重要性。
➡️

继续阅读