天天看点

数据挖掘-基础知识-笔记汇总9:贝叶斯与决策树-朴素贝叶斯定理

课程笔记第八篇

本课程笔记的课程来源于清华大学深圳研究生院-袁博老师的《数据挖掘:理论与算法》。视频在学堂在线或者b站都有。

第三章第二节-朴素贝叶斯定理:

数据挖掘-基础知识-笔记汇总9:贝叶斯与决策树-朴素贝叶斯定理

理论上用第三条式子去计算,因为理论上的式子在实际中很难精确计算,因为属性多,实际上用最后的式子计算,做了一个假设,假设它们之间条件独立。假设这些属性在类出现的时候是独立的。

因为是乘积,所以一旦出现了一个为0,就不行了,所以要进行拉普拉斯平滑处理。

NB可用于离散型数据,也可以用于连续性数据。可用于非常多的场合,算出某一个概率,然后最有可能是哪一类,比如文本分类,推荐算法等等。

继续阅读