文本还是图像?对于仇恨迷因检测模型的跨领域泛化能力,哪个更重要?

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究探讨了多模态仇恨迷因检测中的跨领域泛化挑战。研究发现,仅有具有仇恨性质的迷因文本能够使多模态分类器在不同领域中泛化,而图像对特定训练数据集非常敏感。通过黑盒解释,确定了文本模态的重要贡献程度为83%,引入迷因图像标题后减少至52%。评估显示,文本混淆因素性能高于图像混淆因素,平均ΔF1为0.18。

🎯

关键要点

  • 该研究探讨了多模态仇恨迷因检测中的跨领域泛化挑战。
  • 只有具有仇恨性质的迷因文本能够使多模态分类器在不同领域中泛化。
  • 图像对特定训练数据集非常敏感。
  • 通过黑盒解释,文本模态的重要贡献程度为83%。
  • 引入迷因图像标题后,文本模态的贡献程度减少至52%。
  • 评估显示,文本混淆因素性能高于图像混淆因素,平均ΔF1为0.18。
➡️

继续阅读