灾害相关推文识别的主动学习:与关键词过滤和通用微调的比较
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
社交媒体平台上的实时信息对于通知志愿者、应急管理人员和救援组织非常重要。为了解决监测灾害事件的挑战,研究人员提出了一种半监督少样本学习条件下的细粒度灾害推文分类模型。该模型利用少量标注数据和大量无标注数据,能够有效地将推文分类为感兴趣的细粒度类别。通过集成半监督学习方法和引入TextMixUp,该模型在两个灾害数据集上的性能提升了11.2%。研究人员还对标注数据数量和领域外结果的影响进行了分析。
🎯
关键要点
-
社交媒体平台上的实时信息对志愿者、应急管理人员和救援组织至关重要。
-
监测灾害事件的监督学习模型需要大量标注数据,难以在实时灾害事件中应用。
-
提出了一种在半监督少样本学习条件下的细粒度灾害推文分类模型,名为CrisisMatch。
-
CrisisMatch利用少量标注数据和大量无标注数据,有效分类推文为细粒度类别。
-
通过集成半监督学习方法和引入TextMixUp,CrisisMatch在两个灾害数据集上性能提升了11.2%。
-
研究人员分析了标注数据数量和领域外结果的影响。
➡️