天天看點

樸素貝葉斯學習筆記

naivebayes   樸素貝葉斯分類器原理

公式分解:

1.p(word|categroy)=p(分類category的文檔中出現word的文檔總數)/分類category總文檔數

p(word|categroy)意思為在category分類中word出現的機率

2.p(doc|categroy)=p(word1|categroy)*p(word2|categroy)*...*p(wordn|categroy)

p(doc|categroy)文檔屬于某個分類的機率

3.p(categroy|doc)=p(doc|categroy)*p(categroy)/p(doc)

p(categroy|doc)  指定文檔doc為categroy分類的機率

假如有十個分類,分别計算指定文檔這個十個類的機率,即p(categroy|doc),值最大的就是這個文檔的分類

推薦連結:http://www.jianshu.com/p/b8e0ae7cfa39

繼續閱讀