深入了解機器學習——EM算法/最大期望算法（Expectation-Maximization Algorithm, EM）

2022-09-11 00:02:50

在前面的讨論中，我們一直假設訓練樣本所有屬性變量的值都已被觀測到，即訓練樣本是“完整”的。但在現實應用中往往會遇到“不完整”的訓練樣本。在這種存在“未觀測”變量的情形下，是否仍能對模型參數進行估計呢？未觀測變量的學名是“隐變量”（Latent Variable）。令表示已觀測變量集，表示隐變量集，表示模型參數。若欲對做極大似然估計，則應最大化對數似然：

然而由于是隐變量，上式無法直接求解。此時我們可通過對計算期望，來最大化已觀測資料的對數“邊際似然：

EM（Expectation-Maximization）算法是常用的估計參數隐變量的利器，它是一種送代式的方法，其基本想法是：若參數已知，則可根據訓練資料推斷出最優隐變量的值（E步）；反之，若的值已知，則可友善地對參數做極大似然估計（M步）。

于是，以初始值為起點，對上式，可選代執行以下步驟直至收斂：

基于推斷隐變量的期望，記為
基于已觀測變量和對參數做極大似然估計，記為

這就是EM算法的原型。

進一步，若我們不是取的期望，而是基于計算隐變量的機率分布，則EM算法的兩個步驟是：

E步（Expectation）：以目前參數推斷隐變量分布，并計算對數似然關于的期望：
M步卡（Maximization）：尋找參數最大化期望似然，即：

深入了解機器學習——EM算法/最大期望算法（Expectation-Maximization Algorithm, EM）

繼續閱讀

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普