NNG-Mix: 利用伪异常生成改进半监督异常检测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
最近邻高斯混合 (NNG-Mix) 是一种新算法,通过整合有标签和无标签数据生成伪异常样本,改进了半监督和监督异常检测算法。在57个数据集上,与常用的数据增强方法相比,取得了显著的性能提升。在ADBench中的经典、计算机视觉和自然语言处理数据集上,最多可提高16.4%、8.8%和8.0%。
🎯
关键要点
- 提出了一种名为最近邻高斯混合 (NNG-Mix) 的新算法。
- 该算法通过整合有标签和无标签数据生成伪异常样本。
- NNG-Mix 用于改进半监督和监督异常检测算法。
- 在57个数据集上,与常用的数据增强方法相比,取得显著的性能提升。
- 在ADBench中的经典数据集上,性能提升最多可达16.4%。
- 在计算机视觉数据集上,性能提升最多可达8.8%。
- 在自然语言处理数据集上,性能提升最多可达8.0%。
➡️