ROC曲線圖詳解
(一)ROC曲線的概念 受試者工作特征曲線(receiver operator characteristic curve, ROC曲線),最初用于評價雷達性能,又稱為接收者操作特性曲線。ROC曲線是根據一系列不同的二分類方式(分界值或決定阈),以真陽性率(靈敏度)為縱坐标,假陽性率(1-特異度)為橫坐标繪制的曲線。 傳統的診斷試驗評價方法有一個共同的特點,必須将試驗結果分為兩類,再進行統計分析。ROC曲線的評價方法與傳統的評價方法不同,無須此限制,而是根據實際情況,允許有中間狀态,可以把試驗結果劃分為多個有序分類,如正常、大緻正常、可疑、大緻異常和異常五個等級再進行統計分析。是以,ROC曲線評價方法适用的範圍更為廣泛。
診斷 泛指某對象(如人、儀器、裝置、試劑、試驗及方法等)對确定事件作出正常或異常判斷的過程。TN真陰性,FN假陰性,TP真陽性,FP假陽性,在日常工作中,很難用特定試驗結果來完美地區分兩組人群:病例組和對照組,如帕金森病的有與無、惡性良性腫瘤的惡性與良性、腫塊的一個與多個等。如圖

所示,檢驗結果往往是重疊的。
對于每一個可能用于區分兩組人群的分割點(cut-off point)或标準值(criterion value),都會将一些病例正确歸類為陽性,即真陽性(True Positive,TP),而将另外一些病例歸類為陰性,即假陰性(False Negative,FN)。另一方面,将一些對照個案正确歸類陰性,即真陰性(True Negative,TF),而将另外一些對照個案歸類為陽性,即假陽性(False Positive,FP)。這些名額可采用2×2列聯表(contingency table)或決策矩陣(decision matrix)定義。
診斷試驗可産生如下統計量:
靈敏度(Sensitivity,Se)稱為真陽性率(true-positive fraction,TPF;或true-positive rate,TPR),為病例組中診斷試驗正确診斷為陽性的機率,。
特異度(Specificity,Sp),稱為真陰性率(true-negative fraction,TNF;或true-negative rate,TNR):為對照組中診斷試驗正确診斷為陰性的機率
假陰性率(false-negative fraction,FNF;或false-negativerate,FNR),為病例組中錯誤診斷試驗為陰性的機率,假陰性将導緻病情延誤與治療延期等危害。
假陽性率(false-positive fraction,FPF;或false-positiverate,FPR),為對照組中診斷試驗錯誤診斷為陽性的機率,。假陽性将導緻治療不正确,患者有時需要遭受風險很大的确證試驗。
陽性似然比(Positive likelihood ratio,LR+),為真陽性率與假陽性率的比值,即陰性似然比(Negative likelihood ratio,LR-),為假陰性率與真陰性率的比值,即。
陽性預測值(Positive predictive value,PPV),為診斷試驗為陽性結果中病人的機率,即陰性預測值(Negative predictive value,NPV),為診斷試驗為陰性結果中非病人的機率。
(二)ROC曲線的生成
假設采用邏輯回歸分類器,其給出針對每個執行個體為正類的機率,那麼通過設定一個門檻值如0.6,機率大于等于0.6的為正類,小于0.6的為負類。對應的就可以算出一組(FPR,TPR),在平面中得到對應坐标點。随着門檻值的逐漸減小,越來越多的執行個體被劃分為正類,但是這些正類中同樣也摻雜着真正的負執行個體,即TPR和FPR會同時增大。門檻值最大時,對應坐标點為(0,0),門檻值最小時,對應坐标點(1,1)。
如下面這幅圖,(a)圖中實線為ROC曲線,線上每個點對應一個門檻值。
(二)ROC曲線的主要作用
1.ROC曲線能很容易地查出任意界限值時的對疾病的識别能力。
2.選擇最佳的診斷界限值。ROC曲線越靠近左上角,試驗的準确性就越高。最靠近左上角的ROC曲線的點是錯誤最少的最好門檻值,其假陽性和假陰性的總數最少。
3.兩種或兩種以上不同診斷試驗對疾病識别能力的比較。在對同一種疾病的兩種或兩種以上診斷方法進行比較時,可将各試驗的ROC曲線繪制到同一坐标中,以直覺地鑒别優劣,靠近左上角的ROC曲線所代表的受試者工作最準确。亦可通過分别計算各個試驗的ROC曲線下的面積(AUC)進行比較,哪一種試驗的 AUC最大,則哪一種試驗的診斷價值最佳。
(三)ROC曲線分析的主要步驟
1.ROC曲線繪制。依據專業知識,對疾病組和參照組測定結果進行分析,确定測定值的上下限、組距以及截斷點(cut-off point),按選擇的組距間隔列出累積頻數分布表,分别計算出所有截斷點的敏感性、特異性和假陽性率(1-特異性)。以敏感性為縱坐标代表真陽性率,(1-特異性)為橫坐标代表假陽性率,作圖繪成ROC曲線。
2.ROC曲線評價統計量計算。ROC曲線下的面積值在1.0和0.5之間。在AUC>0.5的情況下,AUC越接近于1,說明診斷效果越好。即受試對象中所有的病人均為陽性,而所有的非病人均為陰性。AUC在 0.5~0.7時有較低準确性,AUC在0.7~0.9時有一定準确性,AUC在0.9以上時有較高準确性。AUC=0.5時,說明診斷方法完全不起作用,無診斷價值。AUC<0.5不符合真實情況,在實際中極少出現。
明顯看到綠色準确率更高。
3.兩種診斷方法的統計學比較。兩種診斷方法的比較時,根據不同的試驗設計可采用以下兩種方法:①當兩種診斷方法分别在不同受試者身上進行時,采用成組比較法。②如果兩種診斷方法在同一受試者身上進行時,采用配對比較法。
(四)ROC曲線的優點 該方法簡單、直覺,通過圖示可觀察分析方法的臨床準确性,并可用肉眼作出判斷。ROC曲線将靈敏度與特異性以圖示方法結合在一起,可準确反映某分析方法特異性和敏感性的關系,是試驗準确性的綜合代表。ROC曲線不固定分類界值,允許中間狀态存在,利于使用者結合專業知識,權衡漏診與誤診的影響,選擇一更佳截斷點作為診斷參考值。提供不同試驗之間在共同标尺下的直覺的比較,ROC曲線越凸越近左上角表明其診斷價值越大,利于不同名額間的比較。曲線下面積可評價診斷準确性。