天天看點

分類器的常用性能名額的通俗釋義

1. TP(True Postive)、TN(True Negative)、FP(False Negative)、 FN(False Negative)

舉個醫生看病的例子:

假設患病為陽性(Positive),健康為陰性(Negative)

當醫生正确地将患病病人确診為有病,那麼就是TP;當醫生正确地将康複病人确診為沒病,那麼就是TN;

當醫生錯誤地将健康病人确診為有病,那麼就是FP;當醫生錯誤地将患病病人确診為沒病,那麼就是FN;

2. 準确率(Precision)的公式

Precision =TP/(TP+FP)

可以了解為醫生預測對的陽性(患病)數占醫生預測陽性(患病)總量的比率。

但是該名額有局限性,因為沒有用到真正的陽性總數,是以就有了召回率。

3. 召回率(Recall)的公式

Recall = TP/(TP+FN)

可以了解為醫生預測對的陽性(患病)數占真正的陽性(患病)數的比率。

但是該名額同樣也存在局限性,尤其當陰陽樣本失衡——陽性樣本數接近于總樣本數時,是以就有了 F 值。

4. F 值的公式

F=2rp/(p+r)

p 即 Precision, r 即 Recall,是以 F 值又被稱為準确率和召回率的調和值。

單一的準确率高和召回率高并不能說明問題,是以才有了F值的衡量名額。

5. ROC 空間的含義

ROC空間将僞陽性率(FPR)定義為 X 軸,真陽性率(TPR)定義為 Y 軸。這兩個值由上面四個值計算得到,公式如下:

TPR:在所有實際為陽性的樣本中,被正确地判斷為陽性之比率。

TPR=TP/(TP+FN) 【與召回率公式相同】

FPR:在所有實際為陰性的樣本中,被錯誤地判斷為陽性之比率。

FPR=FP/(FP+TN)

放在醫生看病的例子上來了解上述兩個名額:

那麼盡量把有病的揪出來是主要任務,也就是第一個名額TPR,要越高越好;

而把沒病的樣本誤診為有病的,也就是第二個名額FPR,要越低越好;

反映在圖上就是在相同的 FPR 的條件下,TPR越高越好,ROC 曲線下方覆寫的面積越大越好。

分類器的常用性能名額的通俗釋義
分類器的常用性能名額的通俗釋義

繼續閱讀