統計模式識别——Bayes分類器(2)
上一節,我們讨論了最小錯誤率分類器,接下來這一節我們将讨論最小風險Bayes分類器。
最小風險Bayes分類器
1.問題提出
1.最小錯誤率Bayes決策的最小錯誤率——機率意義上最優,在工程上是否是最優?
2.錯誤分類的結果、代價或風險會是怎樣的?(考慮癌細胞圖像識别的例子)
3.出錯的可能情況:正常細胞ω1錯分為異常ω2,異常細胞ω2錯分為正常ω1,這兩者的代價應該是不一樣的。
2.需要區分的概念
狀态:識别的目的是分類,把樣本歸類于其可能的自然狀态(即類别)之一,将這種自然狀态簡稱為狀态,記為ω;
狀态空間:所有可能的狀态的集合構成狀态空間,記為Ω;
決策:把樣本歸類于某個狀态,或不能進行歸類,都是決策,記為α;
決策空間:所有可能的決策(包括拒絕決策)的集合構成決策空間,記為Α;
3.問題已知條件和求解目标
已知:(假設類别C = 2,決策A = 2)
1. ω1、P(ω1)、p(x | ω1)和ω2 、P(ω2)、p(x | ω2)
2. Ω= {ω1,ω2}
3. А = {α1,α2}
4. 定義損失函數λ(αi,ωj) ,簡記λij
發生了一個随機事件,其觀察值為特征向量x
求解:最小風險分類器
4.判别函數
5.決策規則
對于未知樣本x,若R(αk | x) = minR(αi | x),則x∈ωk,即決策αk。
6.推廣到任意狀況
已知:
1. ωj、P(ωj)、p(x|ωj), j = 1,… ,C;
2. Ω= {ω1,ω2,… ,ωC.};
3. А = {α1,α2,… ,αA};
這裡C可以不等于A,因為決策可以有很多,比如拒絕決策
4. 定義損失函數λ(αi,ωj) ,簡記λij;
5. 發生了一個随機事件,其觀察值為特征向量x
求解:最小風險分類器
任意狀況的判别函數
任意狀況的決策規則
對于未知樣本x,若R(αk | x) = minR(αi | x),則x∈ωk,即決策αk。
7.最小風險和最小錯誤率貝葉斯分類器的關系
首先定義0-1損失函數:
則:對于未知樣本x,若R(αk | x) = minR(αi | x),則x∈ωk;
對于未知樣本x,若P(ωk|x) = maxP(ωi|x),則x∈ωk;
結論:最小錯誤率Bayes決策,等價于0-1損失函數的最小風險Bayes決策。
8. 最小風險Bayes決策的特點
1. 已知條件多——各類機率分布及風險系數;
2. 最小錯誤風險——機率意義上工程意義上最優;
3. 設計過程複雜;