跨语言旅行:基准测评多模态大语言模型中的跨语言一致性

本研究针对多模态大语言模型在不同语言间表现一致性不足的问题,提出了新的基准KnowRecall和VisRecall。KnowRecall专注于评估15种语言中关于全球地标的文化和历史问题的知识一致性,而VisRecall则通过描述地标外观在9种语言中检验视觉记忆一致性。实验结果显示,当前最先进的多模态大语言模型仍然难以实现跨语言一致性,强调了开发更具多语言和文化意识模型的必要性。

本研究提出了KnowRecall和VisRecall基准,评估多模态大语言模型在15种语言中对全球地标知识和视觉记忆的一致性。结果表明,现有模型在跨语言一致性方面不足,需要开发更具多语言和文化意识的模型。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文