利用集成多样性增强自训练在样本选择偏差存在时的鲁棒性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出T-相似度作为一种新的置信度度量方法,用于解决自训练中置信度过高的问题。该方法基于线性分类器集合的预测多样性,并在不同数据模态的分类数据集上进行了实验验证。

🎯

关键要点

  • T-相似度是一种新的置信度度量方法,用于解决自训练中的置信度过高问题。

  • 该方法基于线性分类器集合的预测多样性。

  • 自训练是半监督学习中的一种常用方法,通过为未标记数据分配伪标签来迭代训练模型。

  • 本文通过理论分析和实证研究验证了T-相似度在不同数据模态分类数据集上的有效性。

  • 实验中对三种不同的伪标签策略进行了测试。

➡️

继续阅读