天天看点

《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

本节书摘来自华章出版社《r语言数据挖掘:实用项目解析》一书中的第2章,第2.9节无参数方法,作者[印度]普拉迪帕塔·米什拉(pradeepta mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看

2.9 无参数方法

当一个训练数据集不满足任何假定的某种概率分布时,唯一的选择就是通过无参数方法分析数据集。无参数方法不服从概率分布假设。使用无参数方法,我们可以不基于概率分布的前提假设来实施推断和假设检验。现在我们来看当一个数据集不满足任何概率分布前提假设时,可使用的一系列无参数检验。

2.9.1 wilcoxon符号秩检验

如果正态性假设不成立,就需要利用无参数方法来回答这个问题——自动挡和手动挡汽车的市内平均行车里程数是否有差别?

《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

若两个样本恰好成对而又不满足正态性假设,则可使用参数paired:

《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

2.9.2 mann-whitney-wilcoxon检验

若两个样本不匹配、独立且不服从正态分布,则需要使用mann-whitney-wilcoxon检验来判断两个样本的平均差有显著差异的假设。

《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

2.9.3 kruskal-wallis检验

要比较两组以上数据的平均值,也即无参方法的方差分析,可以使用kruskal-wallis检验。这也被称作无分布的统计检验:

《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

继续阅读