采用EM估计GMM的参数

2023-06-11 03:21:24

通常采用EM对GMM参数进行估计。EM（期望值最大，Expectation Maximum）算法思想比较简单，主要分为两个步骤，估计步骤E-step和最大化步骤M-step。首先利用样本对参数进行估计，然后在M-step中将需要估计的参数最大化（通常是求其最大似然估计），不断地迭代此两个步骤，直到收敛。

下面写一下采用EM估计GMM的步骤：

1、初始值确定。

方案1：将协方差矩阵设为单位矩阵，每个模型的先验概率设为1/M，均值设为随机数，即：

采用EM估计GMM的参数

方案2：有k均值（k-mean）聚类算法对样本进行聚类，利用各类的均值作为均值初始值，并计算协方差矩阵作为初始值，每个模型的先验概率取各类样本占样本总数的比例。

2、估计步骤（E-step）

采用EM估计GMM的参数

3、最大化步骤（M-step）

分别按下式更新权值、均值和协方差矩阵：

采用EM估计GMM的参数

有的文献把协方差矩阵当作对角阵处理，则有

采用EM估计GMM的参数

但是这样的假设会给最终结果带来误差，故在运算速度能保证的情况下最好还是采用正常的协方差矩阵估计方法。

4、收敛条件

方案1：不断地迭代E和M步骤，直到：

采用EM估计GMM的参数

方案2：不断地迭代E和M步骤，直到：

采用EM估计GMM的参数

方案1和方案2最终效果接近，但方案2明显运算量小，故一般使用方案2。

整个估计过程就是这样，其中有很多公式推导，没有仔细研究，有时间再看看吧。

（以上内容根据某资料整理，如有雷同，不胜荣幸）

采用EM估计GMM的参数

继续阅读

Codeforces 1417 D. Make Them Equal(思维+构造)

查找算法之二分查找查找算法之二分查找

查找算法学习之二分查找（Python版本）——BinarySearch

CQ V1.0分词bates(基于双数组tire树)—应该是目前最快的中文分词算法

Command Network(POJ 3164)---定根最小树形图模板题题目描述输入格式输出格式输入样例输出样例分析源程序

开源低带宽语音编解码器

241 Different Ways to Add Parentheses（C代码版）

【趋高机器视觉】机器视觉技术原理解析及解决方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

极大似然法(ML)与最大期望法(EM)

C++ 第十五周报告1--《冒泡法排序》

笔试面试题目：滑动窗口(二)

数据结构与算法（27）——排序（二）

Dijkstra--简易版（最短路径）

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

hdu7108哈希