天天看點

面積曲線AUC(area under curve)1 ROC2 AUC

原文連結

1 ROC

首先介紹 ROC。ROC 分析是從醫療分析領域引入了一種新的分類模型 performance 評判方法。

ROC的全名叫做Receiver Operating Characteristic,其主要分析工具是一個畫在二維平面上的曲線——ROC curve。平面的橫坐标是false positive rate(FPR),縱坐标是true positive rate(TPR)。對某個分類器而言,我們可以根據其在測試樣本上的表現得到一個TPR和FPR點對。這樣,此分類器就可以映射成ROC平面上的一個點。調整這個分類器分類時候使用的門檻值,我們就可以得到一個經過(0, 0),(1, 1)的曲線,這就是此分類器的ROC曲線。一般情況下,這個曲線都應該處于(0, 0)和(1, 1)連線的上方。因為(0, 0)和(1, 1)連線形成的ROC曲線實際上代表的是一個随機分類器。雖然,用ROC curve來表示分類器的performance很直覺好用。可是,人們總是希望能有一個數值來标志分類器的好壞。于是Area Under roc Curve(AUC)就出現了。

2 AUC

AUC是一種用來度量分類模型好壞的一個标準。顧名思義,AUC的值就是處于ROC curve下方的那部分面積的大小。通常,AUC的值介于0.5到1.0之間,較大的AUC代表了較好的performance。

AUC的計算方法總結:

AUC的值就是計算出ROC曲線下面的面積

面積曲線AUC(area under curve)1 ROC2 AUC

繼續閱讀