BriefGPT - AI 论文速递 ·

CLIPCleaner：利用CLIP清理噪声标签

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

本研究提出了一种基于标签质量的学习方法——Confident Learning（CL），通过剪枝和概率阈值估算噪声，从而提升模型的准确性。研究表明，CL在多种数据集上有效清除噪声，提高模型性能，并提出了新的框架和方法来处理带噪标签的问题，增强模型的鲁棒性和泛化能力。

🎯

❓

Confident Learning（CL）是一种基于标签质量的学习方法，通过剪枝和概率阈值估算噪声，以提高模型的准确性。

CL在MNIST、Amazon评论库和ImageNet子集等多种数据集上有效清除噪声，提高模型准确性。

研究提出了新的框架NTS，解决多类分类中的标签噪声问题，并提供了相应的代码。

SPR方法通过建模网络特征与one-hot标签之间的线性关系来识别干净数据，并控制假阳率。

利用LP-CLIP技术，通过引入线性探测层和自训练策略，增强模型应对不确定性和挑战的能力。

GRIP方法能够集成噪声鲁棒和噪声清理方法的优势，显著减轻由噪声标签引起的性能下降。

🏷️