本研究提出了MS-FSLHate框架,旨在提高社交媒体上少量样本的仇恨言论检测能力。该框架结合了可学习提示嵌入、CNN-BiLSTM网络和同义词对抗数据增强,显著提升了检测的准确性和适应性,适合资源有限的环境。实验结果表明,其在精确率、召回率和F1值上均优于现有基准。
本研究探讨了传统自然语言处理工具在混合语言数据处理中的挑战,尤其是在仇恨言论检测方面。经过训练的HingBERT模型在Hindi-English数据集上表现优于BERT,显示了混合语言模型在多语言社区中的应用潜力。
本研究评估大型语言模型(LLMs)在低资源语言(如马拉地语)中的应用,特别是在情感分析、新闻分类和仇恨言论检测任务上的表现,结果显示其效果显著不足。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备联合理解、文化和语境意识、广泛的常识知识。然而,它在多语言社交媒体理解和对最新趋势的泛化方面仍有挑战,并且存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备联合理解、文化和语境意识、广泛的常识知识。但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战。同时,在名人和政治家知识的持续发展背景下,可能会出现错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
本文研究了多模态出版物中仇恨言论的检测问题,并提出了联合文本和视觉信息的模型。结果显示,多模态模型无法超越仅分析文本的模型。建议进一步研究该领域和数据集。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备图像-文本配对的联合理解、文化和语境意识、广泛的常识知识。但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战,也存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战,也存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
本文研究了多模态出版物中仇恨言论的检测问题,提出了不同的联合文本和视觉信息的模型,并从 Twitter 收集和注释了大规模数据集 MMHS150K。研究发现,尽管图像对于仇恨言论检测任务很有用,但目前的多模态模型无法超越仅分析文本的模型。作者讨论了原因并开放该领域和数据集以进行进一步研究。
该研究使用合成数据生成方法解决在线仇恨言论检测中数据不足的问题,并提供了三种方法来生成保留原有仇恨情绪但转移仇恨目标的仇恨言论数据样本。结果表明使用合成数据训练的模型表现与仅使用目标领域样本训练的模型相媲美甚至更好。
本文分析了针对性别少数群体的仇恨言论检测问题,并提出了以数据为中心的综合框架,概括数据创建流程。实践者可从该框架中获益。
完成下面两步后,将自动完成登录并继续当前操作。