不平衡分类问题的鲁棒性能指标

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

在不平衡分类问题中,传统性能度量标准对类别不平衡不稳健。提出了对F-score和MCC的稳健修正,保证真正阳性率。通过模拟和实验展示了性能度量标准行为,并讨论了与ROC和精确率-召回率曲线的关联性,提出了如何结合使用的建议。

🎯

关键要点

  • 在不平衡分类问题中,传统性能度量标准如F-score和MCC对类别不平衡不稳健。
  • 当少数类占比接近0时,贝叶斯分类器的真正阳性率(TPR)也趋近于0。
  • 提出了对F-score和MCC的稳健修正,保证在极度不平衡情况下的TPR。
  • 通过模拟和信用违约数据集的实验展示了各种性能度量标准的行为。
  • 讨论了与ROC和精确率-召回率曲线的关联性。
  • 提出了如何将性能度量标准与ROC和精确率-召回率曲线结合使用的建议。
➡️

继续阅读