模型的不确定評估方式
在上面的一篇UA-MA的論文中,文獻中的模型用一種不确定評估方式來過濾掉相對不可靠(高不确定度)的預測,隻選擇某些預測作為學生模型學習的目标。下面簡單講講模型的不确定評估方式吧~
參考文獻:What Uncertainties Do We Need in Bayesian Deep Learning for Computer Vision? (NIPS 2017)
目錄
- 模型的不确定評估方式
-
- 不确定性類型:
-
- 1、感覺不确定性(Epistemic Uncertainty)
- 2、偶然不确定性(Aleatoric Uncertainty)
不确定性類型:
1、感覺不确定性(Epistemic Uncertainty)
特征:與模型相關,是由于訓練不完全導緻的。
在UA-MA中,選擇預測熵(the predictive entropy)作為度量來近似不确定性,預測熵如下:
T是随機向前傳播次數;Pc是t時刻預測中c類的機率。
公式解釋:先算出T次向前傳播後的預測值,然後使用了一個資訊熵公式求出不确定性。
注意,不确定性是在體積水準上估計的,整個體積u的不确定性是{u}∈rh×w×d。
在不确定性這篇論文中是這樣描述的:
對于分類問題:
帶T采樣的隐式模型權重,Wt~q∗θ( W),其中qθ(w)是dropout分布。
這個機率向量p的不确定性可以用機率向量的熵來概括:
對于回歸問題:
通過近似預測平均值進行預測: E ( Y ) = a b ∑ t = 1 T f W ( x ) E(Y)=\frac{a}{b}\sum_{t=1}^{T}f^ W(x) E(Y)=ba∑t=1TfW(x)
σ2:對應于資料中固有的噪聲量
簡單來說,感覺不确定性是用多次預測結果的方差來決定的,在多次預測中,所用的模型參數都是不一樣的,是以這種做法捕獲了模型參數的感覺不确定性。
2、偶然不确定性(Aleatoric Uncertainty)
特征:由于觀測資料中的固有噪聲導緻的,這種不确定性是無法被消除的。
總結:模型不确定性的選擇,偶然不确定性、感覺不确定性,或者結合兩種?
對于以下情況,建立原子不确定性模型很重要:
- 大資料
- 實時應用程式
- 安全關鍵應用
- 小資料集
這篇文章翻譯得挺好的:深度學習中的不确定性