DeCrisisMB:通过记忆库进行偏倚半监督危机推文分类的学习
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
CrisisMatch是一种半监督少样本学习条件下的细粒度灾害推文分类模型,利用少量标注数据和大量无标注数据有效地将推文分类为感兴趣的细粒度类别。通过集成有效的半监督学习方法和引入TextMixUp,CrisisMatch在两个灾害数据集上平均提升了11.2%的性能。
🎯
关键要点
-
CrisisMatch是一种半监督少样本学习的细粒度灾害推文分类模型。
-
该模型利用少量标注数据和大量无标注数据进行推文分类。
-
CrisisMatch能够有效模拟灾害的早期阶段。
-
通过集成半监督学习方法和引入TextMixUp,CrisisMatch在两个灾害数据集上平均提升了11.2%的性能。
-
文章还分析了标注数据数量和领域外结果的影响。
➡️