評價名額中的宏平均和微平均
-
-
-
- 什麼是召回率、準确率和F值?
- 什麼是宏平均和微平均?
- 宏平均和微平均的差別
-
-
要了解宏平均和微平均,首先需要掌握召回率(R)、準确率(F)和F值。
什麼是召回率、準确率和F值?
對于二分類問題,可以将樣例根據其真實類别和分類器類别劃分為:
真正例(True Positive,TP):真實類别為正例,預測類别為正例。
假正例(False Positive,FP):真實類别為負例,預測類别為正例。
真負例(True Negative,TN):真實類别為負例,預測類别為負例。
假負例(False Negative,FN):真實類别為正例,預測類别為負例。
混淆矩陣(Confusion Matrix)如下表所示。
根據混淆矩陣我們可以用下列公式計算P、R、F值
準确率 p = T P T P + F P p=\frac{TP}{TP+FP} p=TP+FPTP
召回率 R = T P T P + F N R=\frac{TP}{TP+FN} R=TP+FNTP
F 1 = 2 ∗ P ∗ R P + R F1=\frac{2*P*R}{P+R} F1=P+R2∗P∗R
什麼是宏平均和微平均?
如果隻有一個二分類混淆矩陣,可以用P、R、F名額進行評價,但是當我們在n個二分類混淆矩陣上要綜合考察評價名額的時候就會用到宏平均和微平均。
宏平均(Macro-averaging),是先對每一個類統計名額值,然後再對所有類求算術平均值。
M a c r o _ P = 1 n ∑ i = 1 n P i Macro\_P=\frac{1}{n}\sum_{i=1}^nP_i Macro_P=n1∑i=1nPi
M a c r o _ R = 1 n ∑ i = 1 n R i Macro\_R=\frac{1}{n}\sum_{i=1}^nR_i Macro_R=n1∑i=1nRi
M a c r o _ F = 1 n ∑ i = 1 n F i Macro\_F=\frac{1}{n}\sum_{i=1}^nF_i Macro_F=n1∑i=1nFi
M a c r o _ F = 2 ∗ M a c r o _ P ∗ M a c r o _ R M a c r o _ P + M a c r o _ R Macro\_F=\frac{2*Macro\_P*Macro\_R}{Macro\_P+Macro\_R} Macro_F=Macro_P+Macro_R2∗Macro_P∗Macro_R
微平均(Micro-averging),是對資料集中的每一個執行個體不分類進行統計建立全局混淆矩陣,然後計算相應名額。
M i c r o _ P = ∑ i = 1 n T P i ∑ i = 1 n T P i + ∑ i = 1 n F P i Micro\_P=\frac{\sum_{i=1}^nTP_i}{\sum_{i=1}^nTP_i+\sum_{i=1}^nFP_i} Micro_P=∑i=1nTPi+∑i=1nFPi∑i=1nTPi
M i c r o _ R = ∑ i = 1 n T P i ∑ i = 1 n T P i + ∑ i = 1 n F N i Micro\_R=\frac{\sum_{i=1}^nTP_i}{\sum_{i=1}^nTP_i+\sum_{i=1}^nFN_i} Micro_R=∑i=1nTPi+∑i=1nFNi∑i=1nTPi
M i c r o _ F = 2 ∗ M i c r o _ P ∗ M i c r o _ R M i c r o _ P + M i c r o _ R Micro\_F=\frac{2*Micro\_P*Micro\_R}{Micro\_P+Micro\_R} Micro_F=Micro_P+Micro_R2∗Micro_P∗Micro_R
宏平均和微平均的差別
宏平均的計算方法獨立于不同類别,将每個類别的P、R、F值單獨計算出來,然後将所有類别的路徑成本直接平均,是以它将各個類别平等對待。
微平均會結合不同類别的貢獻大小來計算平均值。
是以在多分類問題中,如果存在資料不平衡問題,則使用微平均得到的效果更加可信。
參考連結
https://www.cnblogs.com/robert-dlut/p/5276927.html
https://zhuanlan.zhihu.com/p/73054466