拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

2023-03-08 09:58:13

原文連結：http://tecdat.cn/?p=3433

原文出處：拓端資料部落公衆号

本文我們讨論期望最大化理論，應用和評估基于期望最大化的聚類。

軟體包

資料

我們将使用mclust軟體包附帶的“糖尿病”資料。

data(diabetes)

summary(diabetes)

## class glucose insulin sspg## Chemical:36 Min. : 70 Min. : 45.0 Min. : 10.0## Normal :76 1st Qu.: 90 1st Qu.: 352.0 1st Qu.:118.0## Overt :33 Median : 97 Median : 403.0 Median :156.0## Mean :122 Mean : 540.8 Mean :186.1## 3rd Qu.:112 3rd Qu.: 558.0 3rd Qu.:221.0## Max. :353 Max. :1568.0 Max. :748.0

期望最大化（EM）

期望最大化（EM）算法是用于找到最大似然的或在統計模型參數，其中該模型依賴于未觀察到的潛變量最大後驗（MAP）估計的疊代方法。期望最大化（EM）可能是無監督學習最常用的算法。

似然函數

似然函數找到給定資料的最佳模型。

拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

期望最大化（EM）算法

假設我們翻轉硬币并得到以下内容 - 0,1,1,0,0,1,1,0,0,1。我們可以選擇伯努利分布

或者，如果我們有以厘米為機關的人的身高（男性和女性）的資料。高度遵循正常的分布，但男性（平均）比女性高，是以這表明兩個高斯分布的混合模型。

拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

貝葉斯資訊準則（BIC）

以糖尿病資料為例

EM叢集與糖尿病資料使用mclust。

log.likelihood：這是BIC值的對數似然值

n：這是X點的數量

df：這是自由度

BIC：這是貝葉斯資訊标準; 低是好的

ICL：綜合完整X可能性 - BIC的分類版本。

clPairs(X,class.d)

拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

EM的繪圖指令會生成以下四個繪圖：

BIC值用于選擇簇的數量

聚類圖

分類不确定性的圖表

簇的軌道圖

拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

參考文獻

1.R語言k-Shape算法股票價格時間序列聚類

2.R語言中不同類型的聚類方法比較

3.R語言對用電負荷時間序列資料進行K-medoids聚類模組化和GAM回歸

4.r語言鸢尾花iris資料集的層次聚類

5.Python Monte Carlo K-Means聚類實戰

6.用R進行網站評論文本挖掘聚類

7.用于NLP的Python：使用Keras的多标簽文本LSTM神經網絡

8.R語言對MNIST資料集分析探索手寫數字分類資料

9.R語言基于Keras的小資料集深度學習圖像分類

拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

原文連結：http://tecdat.cn/?p=3433

原文出處：拓端資料部落公衆号

軟體包

資料

期望最大化（EM）

似然函數

期望最大化（EM）算法

貝葉斯資訊準則（BIC）

EM的繪圖指令會生成以下四個繪圖：

繼續閱讀

R語言| 中介效應分析，Mediation包和BruceR包，循環Process函數

一套完整實用的IT規劃方法論

miRNA與轉錄組聯合分析

進階資料分析師憑什麼月薪三萬？一文解答你所有困惑

SparkSQL項目練習1 準備資料2 需求：各區域熱門商品Top3

SQL常見計算方法總結

一篇文章帶你使用模組化的思路解決泰迪杯-智慧政務問題（答複意見評價含代碼）

【R語言】GARCH模型的應用一、資料來源二、資料分析三、模型建立四、模型優化五、結論六、實作代碼七、參考資料

資料分析實戰20絕技

Python TensorFlow循環神經網絡RNN-LSTM神經網絡預測股票市場價格時間序列和MSE評估準确性

Matlab随機波動率SV、GARCH用MCMC馬爾可夫鍊蒙特卡羅方法分析匯率時間序列

Lagrange插值的R語言實作

從大資料看技術，為什麼天貓雙11是史上最大數字經濟節日

R語言-相關性分析函數

拓端tecdat|R語言彈性網絡Elastic Net正則化懲罰回歸模型交叉驗證可視化

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

拓端tecdat|R語言：EM算法和高斯混合模型的實作軟體包資料期望最大化（EM）似然函數期望最大化（EM）算法貝葉斯資訊準則（BIC）

原文連結 ：http://tecdat.cn/?p=3433

原文出處：拓端資料部落公衆号

軟體包

資料

期望最大化（EM）

似然函數

期望最大化（EM）算法

貝葉斯資訊準則（BIC）

EM的繪圖指令會生成以下四個繪圖：

繼續閱讀

原文連結：http://tecdat.cn/?p=3433