天天看點

spearman相關性分析_資料的相關分析及SPSS算例

spearman相關性分析_資料的相關分析及SPSS算例

之前寫過一個用excel做的相關系數文章《用Excel做資料間的相關系數》(點選檢視),可以再次溫習。

那麼今天主要講一下用SPSS做相關分析。

Excel的資料分析能力比SPSS還是稍微弱一點的,畢竟SPSS也是主要分析資料的一個軟體,那麼在相關分析的這裡就凸顯了它的強大之處,您再次讀這篇文章《用Excel做資料間的相關系數》,會發現,Excel中的相關系數的分析隻是皮爾遜(Pearson)相關分析。而SPSS中包括了三種相關分析(Pearson/ Kendall’s tau-b / Spearman)。

spearman相關性分析_資料的相關分析及SPSS算例

世間萬物除了因果關系、共變關系還有相關關系。相關關系中分為正相關、負相關和不相關,展現在數字上就是[-1,1]。若想形象的表示兩種資料之間的關系,可以制作一個相關關系散點圖。相關還有偏相關,偏相關是指将其他變量影響予以排除,求兩個變量之間的關系。這些用SPSS軟體都能做到。

spearman相關性分析_資料的相關分析及SPSS算例

下面說一下這三種相關系數的特點。

1、Pearsoncorrelation coefficient皮爾遜相關系數

它是由卡爾·皮爾遜從弗朗西斯·高爾頓在19世紀80年代提出的一個相似卻又稍有不同的想法演變而來的。

該相關系數的前提條件最嚴格:

(1)成對資料;

(2)變量呈正态雙分布;

(3)兩列變量是連續變量;

(4)兩列變量之間的關系是線性關系;

(5)資料間的差距不能太大。

是以我們用pearson相關系數之前要進行資料正态驗證。

2、Kendall’stau-b correlation coefficient 肯德爾相關系數

它是一種秩相關系數,也就說它是做按順序排列的資料相關分析,而且分析的對象是分類變量,比如說人的帥氣程度(很帥、帥、一般帥、不帥),沒有皮爾遜相關系數的那麼多前提條件。

3、Spearman correlation coefficient 斯皮爾曼相關系數

由英國心理學家、統計學家斯皮爾曼根據積差相關的概念推導而來。它也是分析有順序的資料相關性,有線性關系的資料,沒有皮爾遜相關系數的那麼多前提條件的限制。

是以說不是正态分布的資料,可以用後兩種相關系數進行分析。

spearman相關性分析_資料的相關分析及SPSS算例

示範一下SPSS怎麼操作

打開軟體自帶的資料集employee data,我們要分析初始工資和目前工資的相關性。

1、我們首先看一下他們的資料是否呈正态性

這裡用到非參數檢驗(Nonparametric tests),即在總體方差未知或知道甚少的情況下,利用樣本資料對總體分布形态等進行推斷的方法。其實也可以用其他方式進行正态檢驗,可參考下面參考文獻。

這裡就說一下非參數檢驗,如下圖,依次點選分析→非參數檢驗→舊對話框→1-樣本K-S,

spearman相關性分析_資料的相關分析及SPSS算例

這裡面有個正态檢驗,翻譯的是“正常”,這就是正态分布(Normal distribution),其他幾個叫均勻分布、泊松分布、指數分布。我們把初始工資和目前工資放到檢驗變量清單。

spearman相關性分析_資料的相關分析及SPSS算例

點選确定,出結果,發現p<0.05,不是正态分布。那我們就不能用皮爾遜相關系數了(實際上實驗資料一般與正态分布相差不大,可以用皮爾遜相關系數,這裡就用斯皮爾曼相關系數了)。

spearman相關性分析_資料的相關分析及SPSS算例

2、我們檢驗一下線性情況

這裡用到散點圖

如下圖,依次點選圖形→舊對話框→散點

spearman相關性分析_資料的相關分析及SPSS算例

選擇第一個簡單分布

spearman相關性分析_資料的相關分析及SPSS算例

将目前工資放入第一個Y軸,初始工資放入第二個X軸

spearman相關性分析_資料的相關分析及SPSS算例

可以點選标題,加标題

spearman相關性分析_資料的相關分析及SPSS算例

點選确定,出圖,發現初始工資和目前工資,它們之間是呈線性關系的。

spearman相關性分析_資料的相關分析及SPSS算例

3、進行相關分析

依次點選分析→相關→雙變量

spearman相關性分析_資料的相關分析及SPSS算例

把初始工資和目前工資放入變量内,選擇斯皮爾曼相關系數,雙尾檢驗,标記顯著性相關。

spearman相關性分析_資料的相關分析及SPSS算例

點選确定得到結果,發現他們的相關性是0.826,還是比較強相關的。

spearman相關性分析_資料的相關分析及SPSS算例
spearman相關性分析_資料的相關分析及SPSS算例

下面是一個補充内容,

距離的分析,

我們還是以初始工資和目前工資做分析。

如下圖依次點選分析→相關→距離

spearman相關性分析_資料的相關分析及SPSS算例

把初始工資和目前的工資放入變量,選擇變量間,相似性,點選确定。

spearman相關性分析_資料的相關分析及SPSS算例

出結果,相關性0.880

spearman相關性分析_資料的相關分析及SPSS算例

我們求一下皮爾遜相關系數,發現跟距離的一樣,可知,距離用的是皮爾遜方法。

spearman相關性分析_資料的相關分析及SPSS算例

參考文獻:

[1]     統計學三大相關系數,

https://blog.csdn.net/zxyscz/article/details/82014694

[2]     幾個相關系數:Pearson、Spearman、pointbiserialr、kendalltau,

https://blog.csdn.net/mmc2015/article/details/51942066

[3]     kendall秩相關系數,

https://baike.baidu.com/item/kendall%E7%A7%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/6246854?fr=aladdin

[4]     皮爾遜相關系數,

https://baike.baidu.com/item/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/12712835?fr=aladdin

[5]     spearman相關系數,

https://baike.baidu.com/item/spearman%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/7977847?fr=aladdin

[6]     spss如何進行正态性檢驗

https://jingyan.baidu.com/article/e6c8503cb5fc7be54e1a1860.html

[7]     趙小軍,祁祿.SPSS資料分析:問題提出與執行個體導學[M].北京:中國水利水電出版社,2011。

歡迎讨論!

微信文章随筆,描述不當的地方,望指正!

若侵權,請聯系本人删除!

歡迎大家投科學相關的稿件。

愛生活,愛科學!

繼續閱讀