非随机缺失标签上的多重填充半监督学习

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

该论文提出了两种结合多重填补模型的新方法,以提高准确性和减少偏差。一种方法利用多个填补模型创建置信区间,并通过阈值筛选低置信度的伪标签。另一种方法通过过滤不准确的数据和找到可靠的子集来减少偏差。实验证明该方法优于现有方法,具有更高的分类准确性和减少偏差的效果。

🎯

关键要点

  • 该论文提出了两种结合多重填补模型的新方法。
  • 第一种方法利用多个填补模型创建置信区间,并通过阈值筛选低置信度的伪标签。
  • 第二种方法通过过滤不准确的数据和找到可靠的子集来减少偏差。
  • 实验证明该方法在分类准确性和减少偏差方面优于现有方法。
  • 该方法在 MCAR 和 MNAR 情况下显示出高效。
➡️

继续阅读