NNG-Mix: 利用伪异常生成改进半监督异常检测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

最近邻高斯混合 (NNG-Mix) 是一种新算法,通过整合有标签和无标签数据生成伪异常样本,改进了半监督和监督异常检测算法。在57个数据集上,与常用的数据增强方法相比,取得了显著的性能提升。在ADBench中的经典、计算机视觉和自然语言处理数据集上,最多可提高16.4%、8.8%和8.0%。

🎯

关键要点

  • 提出了一种名为最近邻高斯混合 (NNG-Mix) 的新算法。
  • 该算法通过整合有标签和无标签数据生成伪异常样本。
  • NNG-Mix 用于改进半监督和监督异常检测算法。
  • 在57个数据集上,与常用的数据增强方法相比,取得显著的性能提升。
  • 在ADBench中的经典数据集上,性能提升最多可达16.4%。
  • 在计算机视觉数据集上,性能提升最多可达8.8%。
  • 在自然语言处理数据集上,性能提升最多可达8.0%。
➡️

继续阅读