Traveling Across Languages: Benchmarking Cross-Lingual Consistency in Multimodal Large Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了新的基准KnowRecall和VisRecall,用于评估多模态大语言模型在不同语言间的一致性。KnowRecall关注全球地标的文化和历史知识一致性,VisRecall检验视觉记忆一致性。实验结果显示,现有模型在跨语言一致性方面仍存在困难,需要开发更具多语言和文化意识的模型。
🎯
关键要点
- 本研究提出了新的基准KnowRecall和VisRecall,用于评估多模态大语言模型在不同语言间的一致性。
- KnowRecall专注于评估15种语言中关于全球地标的文化和历史知识一致性。
- VisRecall通过描述地标外观在9种语言中检验视觉记忆一致性。
- 实验结果显示,现有模型在跨语言一致性方面仍存在困难。
- 研究强调了开发更具多语言和文化意识的模型的必要性。
➡️