二分类性能指标(最经常使用)
首先一说到二分类性能指标,一般都会祭出混淆矩阵,我们这里给出混淆矩阵:
(TP ,T表示true,p = 1 FN ,F表示预测错误,N表示预测的结果 1 = P,0= N
第一位表示预测结果正确or 错误,第二位表示预测的是1 or 0)
TP = 预测1,实际1(P)
TN = 预测0,实际0(N)
FN = 预测0,实际1(P)
FP = 预测1,实际0(N)
实际是1的总共是:TP + FN
实际是0的总共是:TN + FP
准确率(Accuracy) = (预测对是1的 + 预测对是0的)/总数(实际是1的 + 实际是0的)
准确率(Accuracy) = (TP + TN)/(TP + FN + TN +FP)
意义是预测正确的sample占所有sample的比例,表示了一个分类器的区分能力,注意,这里的区分能力没有偏向于是正例还是负例,这也是Accuracy作为性能指标最大的问题所在
精确率(Precision): TP/(TP + FP)
精确率代表的是:在所有被分类为正例的样本中,真正是正例的比例
这个指标常常被应用于推荐系统中,对某一个商品,以用户喜欢为1,不喜欢为0,使用查准率进行性能衡量。
召回率(Recall):TP/(TP + FN)
召回率的定义是,在所有实际为正例的样本中,被预测为正例的样本比例,简单说就是“总共这么多1,你预测出了多少?”
特异性(Specificity):TN/(TN+FP)
特异性的语义为:实际为负的样本中,有多大概率被预测出来,这个定义和召回率非常像,二者区别只是对象不同,召回率是针对正例,而特异性针对的是负例。可以简单把特异性理解成“负例查全率”。
假正例率 FPR = FP/(FP + TN)
也就是误诊率,实际是假的被判定为真的概率