建立網絡訓練完成之後,我們需要對我們所搭建的網絡訓練出的模型的預測性能進行評價。根據我們的分類任務:主要現在有兩類,一個正類,一個負類。每個樣本,都有0或1的兩個标簽:真正所屬類别标簽和模型預測的結果标簽。兩者是否一緻,是評價分類器表現好壞的一個标準。對于本研究中測試集的分類結果,我們将其分類了四種類别:
(1)TP(True Positive):預測結果為正的正樣本
(2)TN(True Negative):預測結果為負的負樣本
(3)FP(False Positive):預測結果為正的負樣本
(4)FN(False Negative):預測結果為負的正樣本
準确率(Accuracy)、精确度(Precision)、召回率(Recall)和(F-measure)等,都是判斷分類結果性能好壞的常用标準。其計算公式分别如下:
Accuracy = (TP+TN)/(TP+TN+FP+FN)
Precesion = TP/(TP+FP)
Recall = TP/(TP+FN)
F1 = 2PR/(P+R)