噪声标签学习的成对相似度分布聚类
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于自监督训练的方法,通过利用所有训练数据的信息,为每个样本提取有意义且可泛化的嵌入空间,从而去除 out-of-distribution 样本,并使用迭代的 Manifold DivideMix 算法找到干净和有噪音的样本,以半监督的方式训练模型。此外,还提出了一种名为 MixEMatch 的半监督算法,通过在输入和流形空间进行插值提取更好的表示。实验证明了该框架的有效性。
🎯
关键要点
- 提出了一种基于自监督训练的方法,利用所有训练数据的信息。
- 为每个样本提取有意义且可泛化的嵌入空间,去除 out-of-distribution 样本。
- 使用迭代的 Manifold DivideMix 算法找到干净和有噪音的样本,以半监督的方式训练模型。
- 提出了一种名为 MixEMatch 的半监督算法,通过 mixup 增强提取更好的表示。
- 在输入和流形空间进行插值以提高表示效果。
- 对多个合成噪声图像基准和真实世界的网络爬取数据集进行了广泛实验,验证了框架的有效性。
➡️