例题:
写一篇文章,分析男生体测数据各指标之间的相关性,并与女生的数据得到的结论进行对比。
要求:要说明选择哪一种相关系数的原因,并要求做出散点图。(可以自己动手试试相关矩阵可视化哦)

确定相关系数
为了度量两个变量间的线性关系,一般采用皮尔逊(Pearson)相关系数或斯皮尔曼(Spearman)相关系数进行分析。其中,只有当数据满足连续且呈线性关系时,才能使用皮尔逊(Pearson)相关系数描述变量间的相关性,且估计数据显著性时候需要数据服从正态分布;相对地,斯皮尔曼(Spearman)相关系数则没有使用条件限制。
因此,在确定使用哪种相关系数之前,应对各指标数据绘制散点图判断是否呈线性关系以及正态分布检验。
画散点图
由散点图,各指标彼此之间均无线性关系。使用斯皮尔曼相关系数。
斯皮尔曼(Spearman)相关系数
结果分析
系数为0.01,身高与肺活量正相关,与坐位体前屈负相关,立定跳远与体重是正相关。