天天看點

《貝葉斯思維:統計模組化的Python學習法》——1.4 貝葉斯定理

本節書摘來異步社群《貝葉斯思維:統計模組化的python學習法》一書中的第1章,第1.4節,作者:【美】allen b. downey,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

現在,我們準備好進行貝葉斯定理推導需要的所有條件了。首先,我們注意到,聯合機率是乘積可交換(乘法交換律)的,即:

p(a and b) = p(b and a)

對于任何a,b表示的事件都成立。

然後,我們寫出一個聯合機率的表達式:

p(a and b) = p(a)p(b|a)

由于我們并沒有明确定義a和b的含義,因而可以對a、b進行互換操作。

交換它們的位置:

p(b and a) = p(b)p(a|b)

把這些表達式連接配接起來,我們得到下面的表達式:

p(b)p(a|b)= p(a)p(b|a)

這意味着我們有兩種方式計算聯合機率,已知p(a),乘以p(b|a);或者從另一方向,已知p(b),乘以p(a|b)。兩種方法是相同的。

最後,将上式除以p(b),得到:

《貝葉斯思維:統計模組化的Python學習法》——1.4 貝葉斯定理

這正是貝葉斯定理!看起來不起眼,不過它會顯示出令人吃驚的強大之處。

例如,我們可以用它來解決曲奇餅問題。

假設b1表示曲奇餅屬于碗1的機率,v表示曲奇餅是香草曲奇餅的機率。

帶入貝葉斯定理我們得到:

《貝葉斯思維:統計模組化的Python學習法》——1.4 貝葉斯定理

等式左邊就是我們希望得到的,一塊香草曲奇餅來自碗1的機率。

等式的右邊表示:

p(b1):這是我們忽略得到曲奇餅這個條件時(零條件下)選中碗1的機率。因為選擇碗的過程是随機的,我們可以假設p(b1)=1/2。

p(v|b1):這是從碗1得到一個香草曲奇餅的機率=3/4。

p(v):從任意碗裡得到一個香草曲奇餅的機率。因為考慮到選擇碗的機會均等,而且每個碗的曲奇餅數量都是40,得到曲奇餅的機會是相同的。兩個碗中香草和巧克力曲奇餅總數各是50和 30,是以p(v)=5/8。

把它們放在一起,我們得到:

結果是3/5。是以,“得到一塊香草曲奇餅”是支援于假設“來自碗1”的證據,因為香草曲奇餅來自碗1的可能性更大。

這個例子示範了一個應用貝葉斯定理的案例:它提供了一個從p(b|a) 得到p(a|b)的政策。

這種政策在解決類似“曲奇餅問題”的情況下是有用的,即從貝葉斯等式的右邊計算要比左邊容易的情況下。