BriefGPT - AI 论文速递 ·

噪声标签学习的成对相似度分布聚类

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了处理带有噪声标签数据的多种方法，包括 Class2Simi 框架、DivideMix 深度学习框架和选择性有监督对比学习（Sel-CL）方法。这些方法通过利用相似性、半监督学习和可信样本筛选，显著提高了分类准确性和模型鲁棒性，适用于多种噪声数据集。

🎯

❓

Class2Simi 框架通过将带有噪声类标签的数据转化为带有噪声相似性标签的数据对，从而降低噪声率，提高分类精度。

DivideMix 通过将训练数据分为清晰样本和噪声样本，利用半监督学习技术进行联合训练，从而显著提高分类性能。

Sel-CL 方法通过筛选可信样本，减少噪声标签对表示学习的影响，改善了泛化性能，尤其是在依赖高质量标注数据的情况下。

MixEMatch 算法通过 mixup 增强和流形空间插值，提取更好的表示，从而提升模型在噪声数据集上的表现。

SSCC 算法用于提高在嘈杂标签集上的分类准确性，并减少人工标签评估的成本。

通过数据扩充实现相似输入，引入 Paired Softmax Divergence Regularization (PSDR) 流形正则化器，以改善对噪声标签的鲁棒性。

🏷️