周志華機器學習 Day11貝葉斯分類器

2023-07-06 00:28:21

貝葉斯分類器

貝葉斯決策論

貝葉斯決策論是機率架構下實施決策的基本方法。對分類任務來說，在所有相關機率都已知的理想情形下，貝葉斯決策論考慮如何基于這些機率和誤判損失來選擇最優的類别标記。

假設有N種可能的類别标記，即y={c1，c2，.....，cN}，

周志華機器學習 Day11貝葉斯分類器

是将一個真實标記為cj的樣本誤分類為ci所産生的損失，基于後驗機率P（ci | x）可獲得将樣本x分類為ci所産生的期望損失，即在樣本x上的“條件風險”

周志華機器學習 Day11貝葉斯分類器

我們的任務是尋找一個判定标準h：X->Y以最小化總體風險。

貝葉斯判定準則：為最小化總體風險，隻需在每個樣本上選擇哪個能使條件風險R（c | x）最小的類别标記。

具體來說，若目标是最小化分類錯誤率，則誤判損失

周志華機器學習 Day11貝葉斯分類器

可寫為

周志華機器學習 Day11貝葉斯分類器

此時條件風險

周志華機器學習 Day11貝葉斯分類器

于是，最小化分類錯誤率的貝葉斯最優分類器為

周志華機器學習 Day11貝葉斯分類器

不難看出，欲使用貝葉斯判定準則來最小化決策風險，首先要獲得後驗機率P（c | x），這在現實中是難以直接獲得的。

對于後驗機率的估計有兩種方法：（1）“判别式模型”，給定x，通過直接模組化P（c | x）來預測c （2）“生成式模型”，對聯合機率分布P（x，c）模組化得到P（c | x）；一般地，有決策樹、BP神經網絡、支援向量機

對生成式模型來說，必然考慮

周志華機器學習 Day11貝葉斯分類器

基于貝葉斯定理，P（c | x）可寫為

周志華機器學習 Day11貝葉斯分類器

事實上，機率模型的訓練過程就是參數估計過程。

樸素貝葉斯分類器

基于貝葉斯公式估計後驗機率P（c | x）的主要困難在于：類條件機率P（c | x）是所有屬性上的聯合機率，難以從有限訓練樣本直接估計而得。為了避開這個障礙，樸素貝葉斯分類器采用了“屬性條件獨立性假設”：對已知類别，假設所有屬性互相獨立。換言之，假設每個屬性獨立地對分類結果發生影響。

基于屬性條件獨立性假設，可得

周志華機器學習 Day11貝葉斯分類器

其中，d為屬性數目，xi為x在第i個屬性上的取值。

’

周志華機器學習 Day11貝葉斯分類器

貝葉斯分類器

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

周志華 機器學習 Day11貝葉斯分類器

貝葉斯分類器

繼續閱讀

周志華機器學習 Day11貝葉斯分類器