Stanceosaurus 2.0: 对俄语和西班牙语虚假信息进行态度分类
原文中文,约300字,阅读约需1分钟。发表于: 。通过将西班牙语和俄语纳入 Stanceosaurus 2.0 框架,从而提供了 41 个误传事件中的 3,874 个西班牙语和俄语推文,以支持与多文化误传相关的研究,并通过使用零射多语言 BERT 进行跨语言转移来证明了立场分类作为识别多元文化误传的有效工具。
该论文研究了阿拉伯语新闻中使用文本蕴含的应用,并使用了新的语料库。作者开发了两个机器学习模型,用于断言验证和立场预测任务。最佳模型使用预训练(BERT)在立场预测任务上取得了76.7 F1的成绩,在断言验证任务上取得了64.3 F1的成绩。结果显示,预训练学习到的语言特征和世界知识对立场预测有用,但对于没有上下文或证据的断言验证不够。