不平衡分类问题的鲁棒性能指标
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
在不平衡分类问题中,传统性能度量标准对类别不平衡不稳健。提出了对F-score和MCC的稳健修正,保证真正阳性率。通过模拟和实验展示了性能度量标准行为,并讨论了与ROC和精确率-召回率曲线的关联性,提出了如何结合使用的建议。
🎯
关键要点
- 在不平衡分类问题中,传统性能度量标准如F-score和MCC对类别不平衡不稳健。
- 当少数类占比接近0时,贝叶斯分类器的真正阳性率(TPR)也趋近于0。
- 提出了对F-score和MCC的稳健修正,保证在极度不平衡情况下的TPR。
- 通过模拟和信用违约数据集的实验展示了各种性能度量标准的行为。
- 讨论了与ROC和精确率-召回率曲线的关联性。
- 提出了如何将性能度量标准与ROC和精确率-召回率曲线结合使用的建议。
➡️