本研究提出了MS-FSLHate框架,旨在提高社交媒体上少量样本的仇恨言论检测能力。该框架结合了可学习提示嵌入、CNN-BiLSTM网络和同义词对抗数据增强,显著提升了检测的准确性和适应性,适合资源有限的环境。实验结果表明,其在精确率、召回率和F1值上均优于现有基准。
本研究提出了一种基于模型蒸馏的仇恨言论检测方法,解决了现有模型的可解释性问题。通过链式思维提取解释,蒸馏后的模型在分类性能上超过大型模型,为仇恨言论检测的经济性和可行性做出了贡献。
本研究评估大型语言模型(LLMs)在低资源语言(如马拉地语)中的应用,特别是在情感分析、新闻分类和仇恨言论检测任务上的表现,结果显示其效果显著不足。
该研究评估了基于Transformer的语言模型在印地语、孟加拉语和泰卢固语等印度语言上的性能,发现微调预训练模型比从头训练更有效。同时,研究探讨了仇恨言论检测,提出了有效策略,并在多种语言中进行比较分析,结果显示GPT-4在低资源语言处理中的表现优越。
本文探讨了大型语言模型(LLMs)的安全性评估与对抗攻击,分析了其漏洞及防御措施。研究表明,LLMs能够生成对抗性样本,影响仇恨言论检测系统。提出了新型攻击策略和防御框架,强调了Prompt Hacking和对抗攻击的威胁,呼吁加强防御能力以应对复杂攻击。
该研究探讨了大型语言模型(LLMs)在对抗性攻击中的表现,提出了多种攻击方法及其对安全性的影响。研究发现,LLMs能够生成有效的对抗性示例,影响仇恨言论检测系统的可靠性。同时,提出了新型攻击向量,以提升LLMs的安全性,减少滥用风险。
本文探讨了社交媒体内容中的仇恨言论检测及联邦学习在隐私保护中的应用,分类了安全和隐私挑战,重点关注各种攻击方式。研究表明,联邦学习在医学领域的应用优于单一客户数据训练,强调了提高系统鲁棒性和隐私保护的重要性。
本文提出了一种新颖的个性化大语言模型方法,通过高效的参数微调和仿生记忆机制,提升用户导向生成任务的效果。研究表明,个性化调整显著提高了情感识别和仇恨言论检测等任务的性能。此外,开发了多阶段框架以增强个性化文本生成能力,并引入LaMP基准测试评估个性化输出。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备联合理解、文化和语境意识、广泛的常识知识。然而,它在多语言社交媒体理解和对最新趋势的泛化方面仍有挑战,并且存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备联合理解、文化和语境意识、广泛的常识知识。但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战。同时,在名人和政治家知识的持续发展背景下,可能会出现错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
本文研究了多模态出版物中仇恨言论的检测问题,并提出了联合文本和视觉信息的模型。结果显示,多模态模型无法超越仅分析文本的模型。建议进一步研究该领域和数据集。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备图像-文本配对的联合理解、文化和语境意识、广泛的常识知识。但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战,也存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战,也存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。
本文研究了多模态出版物中仇恨言论的检测问题,提出了不同的联合文本和视觉信息的模型,并从 Twitter 收集和注释了大规模数据集 MMHS150K。研究发现,尽管图像对于仇恨言论检测任务很有用,但目前的多模态模型无法超越仅分析文本的模型。作者讨论了原因并开放该领域和数据集以进行进一步研究。
该研究使用合成数据生成方法解决在线仇恨言论检测中数据不足的问题,并提供了三种方法来生成保留原有仇恨情绪但转移仇恨目标的仇恨言论数据样本。结果表明使用合成数据训练的模型表现与仅使用目标领域样本训练的模型相媲美甚至更好。
本文分析了针对性别少数群体的仇恨言论检测问题,并提出了以数据为中心的综合框架,概括数据创建流程。实践者可从该框架中获益。
完成下面两步后,将自动完成登录并继续当前操作。