本研究通过社会文化语言学理论填补文化自然语言处理的理论空白,强调局部化视角促进文化能力,深入理解文化演变。
本研究提出了一个新的基准,用于评估生成性大型语言模型在低资源语言丹麦语中的文化能力。实验结果表明,该基准能够有效区分模型性能,并揭示模型在丹麦语适应中的一致性因素。
研究人员构建了CVQA,一个多元文化多语言视觉问答基准,覆盖了28个国家的文化驱动图像和问题,包括26种语言和11种文字,共提供了9k个问题。基准测试显示该数据集对当前最先进的模型具有挑战性,可评估多模态模型的文化能力和偏见,鼓励增加文化意识和语言多样性的研究。
完成下面两步后,将自动完成登录并继续当前操作。