高斯混合模型GMM（Gaussian Mixture Model）

2023-08-04 05:27:55

統計學習的模型有兩種，一種是機率模型，一種是非機率模型。

所謂機率模型，是指訓練模型的形式是P(Y|X)。輸入是X，輸出是Y，訓練後模型得到的輸出不是一個具體的值，而是一系列的機率值（對應于分類問題來說，就是輸入X對應于各個不同Y（類）的機率），然後我們選取機率最大的那個類作為判決對象（軟分類--soft assignment）。所謂非機率模型，是指訓練模型是一個決策函數Y=f(X)，輸入資料X是多少就可以投影得到唯一的Y，即判決結果（硬分類--hard assignment）。

GMM假設樣本分布是幾個高斯分布的權重和。

混合高斯模型定義為：

高斯混合模型GMM（Gaussian Mixture Model）

其中K 為模型的個數；πk為第k個高斯的權重；p（x / k）則為第k個高斯機率密度，其均值為μk，方差為σk。對此機率密度的估計就是要求出πk、μk 和σk 各個變量----是為參數估計。

在做參數估計的時候，常采用的是最大似然方法。最大似然法就是使樣本點在估計的機率密度函數上的機率值最大。由于機率值一般都很小，N 很大的時候, 連乘的結果非常小，容易造成浮點數下溢。是以我們通常取log，将目标改寫成：

高斯混合模型GMM（Gaussian Mixture Model）

一般用來做參數估計的時候，我們都是通過對待求變量進行求導來求極值，在上式中，log函數中又有求和，你想用求導的方法算的話方程組将會非常複雜，沒有閉合解。可以采用的求解方法是EM算法。

第一步：假設知道各個高斯模型的參數（可以初始化一個，或者基于上一步疊代結果），去估計每個高斯模型的權值（πk）；

第二步,基于估計的權值，回過頭再去确定高斯模型的參數（μk 和σk ）。

重複這兩個步驟直至算法收斂。

———————————————————————————————————————————————

下面的是具體EM算法，了解即可：

1、（E step）

假設高斯模型的參數是已知，對于第i個樣本xi 來說，它由第k 個model 生成的機率為：

高斯混合模型GMM（Gaussian Mixture Model）

2、（M step）

高斯混合模型GMM（Gaussian Mixture Model）

3、重複上述兩步驟直到算法收斂。

高斯混合模型GMM（Gaussian Mixture Model）

繼續閱讀

視訊對象分割（Video Object Segmentation）研究小記任務定義與資料集技術路線分類基于神經網絡的模型總結

android學習筆記3：存儲資料存儲 Key-Value 集資料儲存到檔案

安卓學習筆記（九）網絡程式設計網絡程式設計

安卓學習筆記（一） Activity篇

opencv視覺跟蹤——消除背景模組化

django短信驗證碼的後端實作

圖形處理單元(GPU)的演進

天池龍珠計劃Python訓練營-task2筆記清單元組字元串字典集合序列

2021-09-30三維點雲測量正方形包裹體積

2022秋招cpp相關面試總結（長期更新）1、記憶體對齊2、類的占用空間死鎖elf優化bin檔案c語言和c++中const差別sizeof原理malloc一塊記憶體free怎麼找到頭尾

2022秋招面試總結（cpp+java+測開）百度測開一面位元組後端一面蝦皮後端一面蝦皮後端二面

DOG算子

nagios服務端搭建

Apache 虛拟主機搭建過程

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

判斷浏覽器類型與版本以及ios安卓判别