LLVMs4Protest: 利用大型语言和视觉模型解读新闻中的抗议事件
原文中文,约400字,阅读约需1分钟。发表于: 。大型语言和视觉模型已经改变了社会运动学者如何识别抗议活动并从多模态数据中提取关键的抗议属性。本文描述了我们如何通过对大规模预训练的转换器模型(包括 longformer 和 swin-transformer v2)进行微调,使用文本和图像数据来推断新闻文章中的潜在抗议活动。我们为下游任务使用 Dynamic of Collective Action (DoCA) Corpus 训练了...
研究发现,GPT-3和GPT-4等大型语言模型在广告宣传检测中表现良好,与RoBERTa方法相当。研究还分析了大型语言模型在复杂任务中的潜力和挑战。