BriefGPT - AI 论文速递 ·

PEPL：用于细粒度图像分类的精确增强伪标注法在半监督学习中的应用

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文探讨了伪标记在半监督学习中的应用，提出了多种提升模型性能的方法，如基于半监督学习的伪标记、SimPLE算法和SemCo方法。研究表明，这些方法在多个数据集上表现优异，尤其在标签稀缺情况下显著提高了准确率，推动了半监督学习的发展。

🎯

伪标记方法通过将伪标记应用于无标签样本，并利用已训练模型标记这些样本，迭代训练模型，取得了优异的结果。
在CIFAR-10数据集上，仅使用4,000个标记样本，准确率达到94.91%；在Imagenet-ILSVRC数据集上，仅使用10%的标记样本，top-1准确率达到68.87%。
SimPLE算法结合Pair Loss和MixMatch技术，显著提升了CIFAR-100和Mini-ImageNet的性能，并在CIFAR-10和SVHN上达到了最新水平。
SemCo方法结合标签语义和联合训练，解决了伪标记质量差的问题，在Mini-ImageNet数据集上提高了5.6%的准确性。
MarginMatch结合一致性正则化和伪标记，确保低质量预测被屏蔽，在低数据情况下显著提高了CIFAR-100和STL-10的性能。
提出的轻量级通道级集成方法有效合并多个伪标签，显著优于现有技术，提升了效果和效率。
自适应阈值伪标注策略解决了固定阈值导致的性能问题，实验结果显示在部分标记设置下优于其他方法。
研究识别出伪标签在自监督和无监督方法中的广泛应用，表明不同领域的进展可以相互促进。

❓

伪标记通过将伪标记应用于无标签样本，并利用已训练模型标记这些样本，迭代训练模型，从而显著提高模型的准确率。

SimPLE算法结合Pair Loss和MixMatch技术，通过挖掘标记和未标记数据之间的关系，显著提升了CIFAR-100和Mini-ImageNet的性能。

SemCo方法结合标签语义和联合训练，解决了半监督学习中伪标记质量差的问题，提高了Mini-ImageNet数据集的准确性。

MarginMatch结合一致性正则化和伪标记，使用无标签数据的训练动态来衡量伪标签的质量，确保低质量预测被屏蔽。

自适应阈值伪标注策略解决了固定阈值导致的性能问题，在部分标记设置下表现优于其他方法。

研究识别出伪标签在自监督和无监督方法中的广泛应用，表明不同领域的进展可以相互促进。

🏷️