探索边界和强度:揭示社交媒体言论的复杂范围
原文中文,约400字,阅读约需1分钟。发表于: 。使用 8,258 条推特进行标注,该研究创建了一个广泛的 Amharic 基准数据集,用于三个任务:分类、识别仇恨目标和评估冒犯和仇恨的强度。结果显示,仇恨和冒犯性言论无法用简单的二元分类解决,并且在连续数值范围内变量化。Afro-XLMR-large 模型在这些任务中表现出最好的性能,分别达到了 75.30%,70.59%和 29.42%的 F1 分数。Afro-XLMR-large...
该研究使用推特数据创建了Amharic基准数据集,用于分类和评估仇恨目标、冒犯和仇恨的强度。结果显示,仇恨和冒犯性言论无法简单地进行二元分类,而是在连续数值范围内变化。Afro-XLMR-large模型在这些任务中表现最好,具有强大的一致性。