Multi3Hate:基于视觉-语言模型的多模态、多语言和多文化仇恨言论检测
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本研究创建了首个多模态多语言平行仇恨言论数据集Multi3Hate,包含5种语言的300个样本,发现文化背景对标注一致性有显著影响,尤其在美国与印度之间仅为67%。
🎯
关键要点
- 本研究创建了首个多模态多语言平行仇恨言论数据集Multi3Hate。
- 数据集包含来自5种语言的300个平行样本。
- 研究发现文化背景对仇恨言论的标注一致性有显著影响。
- 美国与印度之间的标注一致性低至67%。
- 当前的视觉-语言模型对不同文化的适应性不足。
➡️