本文研究了多模态出版物中仇恨言论的检测问题,并提出了联合文本和视觉信息的模型。结果显示,多模态模型无法超越仅分析文本的模型。建议进一步研究该领域和数据集。
本文研究了多模态出版物中仇恨言论的检测问题,提出了不同的联合文本和视觉信息的模型,并从 Twitter 收集和注释了大规模数据集 MMHS150K。研究发现,尽管图像对于仇恨言论检测任务很有用,但目前的多模态模型无法超越仅分析文本的模型。作者讨论了原因并开放该领域和数据集以进行进一步研究。
完成下面两步后,将自动完成登录并继续当前操作。