研究显示,视觉-语言模型在图像理解中存在西方偏见。通过评估多元文化的图像和注释,发现这些模型在西方文化任务上表现更佳。实验强调预训练中使用多样语言的重要性,以构建更公平的模型。虽然使用特定文化语言提示能减少偏见,但无法替代全球语言代表性。
完成下面两步后,将自动完成登录并继续当前操作。