首先,我們需要了解一下,什麼是ROC曲線?
ROC曲線,即受試者工作特征曲線(Receiver Operating Characteristic curve,簡稱ROC曲線,是根據一系列不同的二分類方式,以真陽性率(TPR)為縱坐标,假陽性率(FPR)為橫坐标繪制成的曲線,描述的是一個模型的性能。
依舊是以之前的圖檔為例子:
對于ROC曲線,我們可以首先求出TPR和FPR兩個名額:
以下圖為例,
哪條ROC曲線對應的分類器效果好?
我們将曲線與x軸的面積定義為AUC(Area Under Curve),即ROC曲線下的面積。其中,AUC越大,代表分類器的效果越好。是以,B的效果要比A好得多。
AUC的取值範圍通常為【0.5,1】之間,倘若一個模型的AUC的值小于0.5,那麼我們便認為這個模型是沒有意義的。