基于 BERT 的阿拉伯语事件 - 参数提取语料库与建模
原文中文,约300字,阅读约需1分钟。发表于: 。我们在阿拉伯语中引入了 hadath 语料库,其丰富了 Wojood 语料库中的事件论证注释。我们使用三种类型的事件论证:agent、location 和 date,并将其注释为关系类型。我们提出了一种使用 BERT 的新方法来进行事件关系提取,其中我们将任务视为文本蕴涵。该方法取得了 94.01% 的 F1 分数。最后,我们提出了一个用于事件论证提取的端到端系统。
该论文研究了阿拉伯语新闻中使用文本蕴含的应用,开发了两个机器学习基线模型用于断言验证和立场预测任务。最佳模型利用预训练技术,在立场预测任务上取得了76.7 F1的成绩,在断言验证任务上取得了64.3 F1的成绩。结果显示,预训练学习到的语言特征和世界知识对于立场预测有用,但对于没有上下文或证据的断言验证不够。