分类模型的性能评估——以SAS Logistic回归为例(1): 混淆矩阵

跑完分类模型（Logistic回归、决策树、神经网络等），我们经常面对一大堆模型评估的报表和指标，如Confusion Matrix、ROC、Lift、Gini、K-S之类（这个单子可以列很长），往往让很多在业务中需要解释它们的朋友头大：“这个模型的Lift是4，表明模型运作良好。——啊，怎么还要解释ROC，ROC如何如何，表明模型表现良好……”如果不明白这些评估指标的背后的直觉，就很可能陷入这样的机械解释中，不敢多说一句，就怕哪里说错。本文就试图用一个统一的例子（SAS Logistic回归），从实际应用而不是理论研究的角度，对以上提到的各个评估指标逐一点评，并力图表明：这些评估指标，都是可以用白话（plain English, 普通话）解释清楚的；它们是可以手算出来的，看到各种软件包输出结果，并不是一个无法探究的“黑箱”；它们是相关的。你了解一个，就很容易了解另外一个。本文从混淆矩阵(Confusion Matrix，或分类矩阵，Classification Matrix)开始，它最简单，而且是大多数指标的基础。

分类模型的性能评估——以SAS Logistic回归为例(1): 混淆矩阵

验证