小红花·文摘

本研究提出了MS-FSLHate框架，旨在提高社交媒体上少量样本的仇恨言论检测能力。该框架结合了可学习提示嵌入、CNN-BiLSTM网络和同义词对抗数据增强，显著提升了检测的准确性和适应性，适合资源有限的环境。实验结果表明，其在精确率、召回率和F1值上均优于现有基准。

Few-shot Hate Speech Detection Based on the MindSpore Framework

BriefGPT - AI 论文速递 ·

本研究提出了一种基于模型蒸馏的仇恨言论检测方法，解决了现有模型的可解释性问题。通过链式思维提取解释，蒸馏后的模型在分类性能上超过大型模型，为仇恨言论检测的经济性和可行性做出了贡献。

Efficient and Explainable Hate Speech Detection Based on Model Distillation

BriefGPT - AI 论文速递 ·

本研究评估大型语言模型（LLMs）在低资源语言（如马拉地语）中的应用，特别是在情感分析、新闻分类和仇恨言论检测任务上的表现，结果显示其效果显著不足。

Limitations of Large Language Models as Annotators for Low-Resource Languages

BriefGPT - AI 论文速递 ·

该研究评估了基于Transformer的语言模型在印地语、孟加拉语和泰卢固语等印度语言上的性能，发现微调预训练模型比从头训练更有效。同时，研究探讨了仇恨言论检测，提出了有效策略，并在多种语言中进行比较分析，结果显示GPT-4在低资源语言处理中的表现优越。

1-800-共享任务 @ Devanagari 脚本语言的自然语言理解：使用大型语言模型检测语言、仇恨言论和目标

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）的安全性评估与对抗攻击，分析了其漏洞及防御措施。研究表明，LLMs能够生成对抗性样本，影响仇恨言论检测系统。提出了新型攻击策略和防御框架，强调了Prompt Hacking和对抗攻击的威胁，呼吁加强防御能力以应对复杂攻击。

迅速升级：单回合渐增攻击（STCA）

BriefGPT - AI 论文速递 ·

该研究探讨了大型语言模型（LLMs）在对抗性攻击中的表现，提出了多种攻击方法及其对安全性的影响。研究发现，LLMs能够生成有效的对抗性示例，影响仇恨言论检测系统的可靠性。同时，提出了新型攻击向量，以提升LLMs的安全性，减少滥用风险。

大规模语言模型的对抗性搜索引擎优化

BriefGPT - AI 论文速递 ·

本文探讨了社交媒体内容中的仇恨言论检测及联邦学习在隐私保护中的应用，分类了安全和隐私挑战，重点关注各种攻击方式。研究表明，联邦学习在医学领域的应用优于单一客户数据训练，强调了提高系统鲁棒性和隐私保护的重要性。

一种隐私保护冒犯性语言识别的联邦学习方法

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的个性化大语言模型方法，通过高效的参数微调和仿生记忆机制，提升用户导向生成任务的效果。研究表明，个性化调整显著提高了情感识别和仇恨言论检测等任务的性能。此外，开发了多阶段框架以增强个性化文本生成能力，并引入LaMP基准测试评估个性化输出。

带参数化内存注入的个性化 LLM 响应生成

BriefGPT - AI 论文速递 ·

GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果，具备联合理解、文化和语境意识、广泛的常识知识。然而，它在多语言社交媒体理解和对最新趋势的泛化方面仍有挑战，并且存在错误信息生成的倾向。研究结果显示，大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。

FakeNewsGPT4：通过知识增强的 LVLMs 推进多模态假新闻检测

BriefGPT - AI 论文速递 ·

GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果，具备联合理解、文化和语境意识、广泛的常识知识。但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战。同时，在名人和政治家知识的持续发展背景下，可能会出现错误信息生成的倾向。研究结果显示，大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。

SoMeLVLM：用于社交媒体处理的大型视觉语言模型

BriefGPT - AI 论文速递 ·

本文研究了多模态出版物中仇恨言论的检测问题，并提出了联合文本和视觉信息的模型。结果显示，多模态模型无法超越仅分析文本的模型。建议进一步研究该领域和数据集。

对齐先于关注：为多模态仇恨内容检测对齐视觉和文字特征

BriefGPT - AI 论文速递 ·

GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果，具备图像-文本配对的联合理解、文化和语境意识、广泛的常识知识。但在多语言社交多媒体理解和对社交媒体最新趋势的泛化方面仍有挑战，也存在错误信息生成的倾向。研究结果显示，大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。