Multi3Hate:基于视觉-语言模型的多模态、多语言和多文化仇恨言论检测

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本研究创建了首个多模态多语言平行仇恨言论数据集Multi3Hate,包含5种语言的300个样本,发现文化背景对标注一致性有显著影响,尤其在美国与印度之间仅为67%。

🎯

关键要点

  • 本研究创建了首个多模态多语言平行仇恨言论数据集Multi3Hate。
  • 数据集包含来自5种语言的300个平行样本。
  • 研究发现文化背景对仇恨言论的标注一致性有显著影响。
  • 美国与印度之间的标注一致性低至67%。
  • 当前的视觉-语言模型对不同文化的适应性不足。
➡️

继续阅读