小红花·文摘

研究显示，视觉-语言模型在图像理解中存在西方偏见。通过评估多元文化的图像和注释，发现这些模型在西方文化任务上表现更佳。实验强调预训练中使用多样语言的重要性，以构建更公平的模型。虽然使用特定文化语言提示能减少偏见，但无法替代全球语言代表性。