例題:
寫一篇文章,分析男生體測資料各名額之間的相關性,并與女生的資料得到的結論進行對比。
要求:要說明選擇哪一種相關系數的原因,并要求做出散點圖。(可以自己動手試試相關矩陣可視化哦)

确定相關系數
為了度量兩個變量間的線性關系,一般采用皮爾遜(Pearson)相關系數或斯皮爾曼(Spearman)相關系數進行分析。其中,隻有當資料滿足連續且呈線性關系時,才能使用皮爾遜(Pearson)相關系數描述變量間的相關性,且估計資料顯著性時候需要資料服從正态分布;相對地,斯皮爾曼(Spearman)相關系數則沒有使用條件限制。
是以,在确定使用哪種相關系數之前,應對各名額資料繪制散點圖判斷是否呈線性關系以及正态分布檢驗。
畫散點圖
由散點圖,各名額彼此之間均無線性關系。使用斯皮爾曼相關系數。
斯皮爾曼(Spearman)相關系數
結果分析
系數為0.01,身高與肺活量正相關,與坐位體前屈負相關,立定跳遠與體重是正相關。