BLEnD: 基于多元文化和语言的常识性 LLM 基准

📝

内容提要

LLMs 在文化敏感性方面缺乏对日常生活的文化特定知识,不同于在线来源如维基百科,BLEnD 通过手工设计的基准评估了 LLMs 对多元文化和语言的日常知识,结果显示 LLMs 在高度在线代表的文化中表现更好,而在低资源语言文化中表现更好的是英语而非本地语言。

🏷️

标签

➡️

继续阅读