本研究提出了新的基准KnowRecall和VisRecall,用于评估多模态大语言模型在不同语言间的一致性。KnowRecall关注全球地标的文化和历史知识一致性,VisRecall检验视觉记忆一致性。实验结果显示,现有模型在跨语言一致性方面仍存在困难,需要开发更具多语言和文化意识的模型。
本研究探讨大型语言模型在生成多语言响应时的文化知识差异。提供文化上下文可提升模型的本地化能力,并发现可跨非英语语言使用的文化定制向量,从而增强多样性并减少刻板印象。
本研究提出了CROPE,一个新的视觉问答基准,用于评估视觉和语言模型在文化知识和适应能力方面的表现。研究发现,现有模型在处理多模态信息和文化概念上有困难,显示了其在文化理解上的局限性。
研究通过调查118篇论文,分析了158项关于有毒模因的工作,提出了新的分类法,识别模因毒性的三个维度:目标、意图和传达策略。探讨了跨模态推理、专家和文化知识整合的挑战,强调了自动毒性解释和处理资源匮乏语言的需求,并提出未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。