Traveling Across Languages: Benchmarking Cross-Lingual Consistency in Multimodal Large Language Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了新的基准KnowRecall和VisRecall,用于评估多模态大语言模型在不同语言间的一致性。KnowRecall关注全球地标的文化和历史知识一致性,VisRecall检验视觉记忆一致性。实验结果显示,现有模型在跨语言一致性方面仍存在困难,需要开发更具多语言和文化意识的模型。

🎯

关键要点

  • 本研究提出了新的基准KnowRecall和VisRecall,用于评估多模态大语言模型在不同语言间的一致性。
  • KnowRecall专注于评估15种语言中关于全球地标的文化和历史知识一致性。
  • VisRecall通过描述地标外观在9种语言中检验视觉记忆一致性。
  • 实验结果显示,现有模型在跨语言一致性方面仍存在困难。
  • 研究强调了开发更具多语言和文化意识的模型的必要性。
➡️

继续阅读