噪声标签学习的成对相似度分布聚类
原文中文,约300字,阅读约需1分钟。发表于: 。通过对样本进行简单而有效的选择算法,我们将训练样本划分为一个干净集和一个带噪声集,使用高斯混合模型来建模相似样本对的相似度分布,从而能够更可靠地判断各个样本的标签置信度,并在各种基准数据集上展示了超越现有方法的显著改进。
本文提出了一种基于自监督训练的方法,通过利用所有训练数据的信息,为每个样本提取有意义且可泛化的嵌入空间,从而去除 out-of-distribution 样本,并使用迭代的 Manifold DivideMix 算法找到干净和有噪音的样本,以半监督的方式训练模型。此外,还提出了一种名为 MixEMatch 的半监督算法,通过在输入和流形空间进行插值提取更好的表示。实验证明了该框架的有效性。