基于子模块互信息的弱监督适用于冷启动主动学习
原文中文,约300字,阅读约需1分钟。
📝
内容提要
STENCIL方法通过选择一组弱标记的稀有类别实例并由注释者进行强标记来改善文本分类数据集的准确性和稀有类别的F-1分数。相对于常见的主动学习方法,STENCIL方法提高了整体准确性和稀有类别F-1分数。
🎯
关键要点
-
STENCIL方法通过选择一组弱标记的稀有类别实例来改善文本分类数据集的准确性。
-
注释者对弱标记的实例进行强标记以提高数据集质量。
-
STENCIL方法在类不平衡冷启动环境下表现优越。
-
相对于常见的主动学习方法,STENCIL方法提高了整体准确性10%至24%。
-
STENCIL方法还提高了稀有类别的F-1分数17%至40%。
🏷️