最近邻高斯混合 (NNG-Mix) 是一种新算法,通过整合有标签和无标签数据生成伪异常样本,改进了半监督和监督异常检测算法。在57个数据集上,与常用的数据增强方法相比,取得了显著的性能提升。在ADBench中的经典、计算机视觉和自然语言处理数据集上,最多可提高16.4%、8.8%和8.0%。
本文研究了类别不平衡挑战对识别任务的影响,发现Sharpness-Aware Minimization (SAM)无法解决泛化问题。为此,提出了Imbalanced-SAM (ImbSAM)算法,通过限制类别无关的SAM的泛化范围来改善对尾类的泛化。实验证明ImbSAM在长尾分类和半监督异常检测等应用中显著提高了性能。
完成下面两步后,将自动完成登录并继续当前操作。