天天看點

先驗機率,後驗機率

對于統計學隻是皮毛認識,在學校時根本不重視,如今機器學習幾乎以統計學為基礎發展起來的,頭疼的緊,如今還得琢磨基礎概念。

1、我自己的了解:

1)先驗:統計曆史上的經驗而知當下發生的機率;

2)後驗:當下由因及果的機率;

2、網上有個例子說的透徹:

1)先驗——根據若幹年的統計(經驗)或者氣候(常識),某地方下雨的機率;

2)似然——下雨(果)的時候有烏雲(因/證據/觀察的資料)的機率,即已經有了果,對證據發生的可能性描述;

3)後驗——根據天上有烏雲(原因或者證據/觀察資料),下雨(結果)的機率;

後驗 ~ 先驗*似然 : 存在下雨的可能(先驗),下雨之前會有烏雲(似然)~ 通過現在有烏雲推斷下雨機率(後驗);

3、再來一例:

先驗機率可了解為統計機率,後驗機率可了解為條件機率。

設定背景:酒至半酣,忽陰雲漠漠,驟雨将至。

情景一:

“天不會下雨的,曆史上這裡下雨的機率是20%”----先驗機率

“但陰雲漠漠時,下雨的機率是80%”----後驗機率

情景二:

“飛飛别急着走啊,曆史上酒桌上死人的機率隻有5%“----先驗機率

”可他是曹操啊,夢裡都殺人“----後驗機率

4、吃瓜群衆的例子

用“瓜熟蒂落”這個因果例子,從機率(probability)的角度說一下,

先驗機率,就是常識、經驗所透露出的“因”的機率,即瓜熟的機率。應該很清楚。

後驗機率,就是在知道“果”之後,去推測“因”的機率,也就是說,如果已經知道瓜蒂脫落,那麼瓜熟的機率是多少。後驗和先驗的關系可以通過貝葉斯公式來求。也就是:

P(瓜熟 | 已知蒂落)=P(瓜熟)×P(蒂落 | 瓜熟)/ P(蒂落)

似然函數,是根據已知結果去推測固有性質的可能性(likelihood),是對固有性質的拟合程度,是以不能稱為機率。在這裡就是說,不要管什麼瓜熟的機率,隻care瓜熟與蒂落的關系。如果蒂落了,那麼對瓜熟這一屬性的拟合程度有多大。似然函數,一般寫成L(瓜熟 | 已知蒂落),和後驗機率非常像,差別在于似然函數把瓜熟看成一個肯定存在的屬性,而後驗機率把瓜熟看成一個随機變量。

再扯一扯似然函數和條件機率的關系。似然函數就是條件機率的逆反。意為:

L(瓜熟 | 已知蒂落)= C × P(蒂落 | 瓜熟),C是常數。具體來說,現在有1000個瓜熟了,落了800個,那條件機率是0.8。那我也可以說,這1000個瓜都熟的可能性是0.8C。

注意,之是以加個常數項,是因為似然函數的具體值沒有意義,隻有看它的相對大小或者兩個似然值的比率才有意義,後面還有例子。

同理,如果了解上面的意義,分布就是一“串”機率。

先驗分布:現在常識不但告訴我們瓜熟的機率,也說明了瓜青、瓜爛的機率

後驗分布:在知道蒂落之後,瓜青、瓜熟、瓜爛的機率都是多少

似然函數:在知道蒂落的情形下,如果以瓜青為必然屬性,它的可能性是多少?如果以瓜熟為必然屬性,它的可能性是多少?如果以瓜爛為必然屬性,它的可能性是多少?似然函數不是分布,隻是對上述三種情形下各自的可能性描述。

那麼我們把這三者結合起來,就可以得到:後驗分布 正比于 先驗分布 × 似然函數。先驗就是設定一種情形,似然就是看這種情形下發生的可能性,兩者合起來就是後驗的機率。

至于似然估計:

就是不管先驗和後驗那一套,隻看似然函數,現在蒂落了,可能有瓜青、瓜熟、瓜爛,這三種情況都有個似然值(L(瓜青):0.6、L(瓜熟):0.8、L(瓜爛):0.7),我們采用最大的那個,即瓜熟,這個時候假定瓜熟為必然屬性是最有可能的。

5、分布解:

先驗分布:根據一般的經驗認為随機變量應該滿足的分布

後驗分布:通過目前訓練資料修正的随機變量的分布,比先驗分布更符合目前資料

似然估計:已知訓練資料,給定了模型,通過讓似然性極大化估計模型參數的一種方法

後驗分布往往是基于先驗分布和極大似然估計計算出來的。

作者:fjssharpsword

來源:CSDN

原文:https://blog.csdn.net/fjssharpsword/article/details/72356277

版權聲明:本文為部落客原創文章,轉載請附上博文連結!

繼續閱讀