课程笔记第八篇
本课程笔记的课程来源于清华大学深圳研究生院-袁博老师的《数据挖掘:理论与算法》。视频在学堂在线或者b站都有。
第三章第二节-朴素贝叶斯定理:
理论上用第三条式子去计算,因为理论上的式子在实际中很难精确计算,因为属性多,实际上用最后的式子计算,做了一个假设,假设它们之间条件独立。假设这些属性在类出现的时候是独立的。
因为是乘积,所以一旦出现了一个为0,就不行了,所以要进行拉普拉斯平滑处理。
NB可用于离散型数据,也可以用于连续性数据。可用于非常多的场合,算出某一个概率,然后最有可能是哪一类,比如文本分类,推荐算法等等。