
之前寫過一個用excel做的相關系數文章《用Excel做資料間的相關系數》(點選檢視),可以再次溫習。
那麼今天主要講一下用SPSS做相關分析。
Excel的資料分析能力比SPSS還是稍微弱一點的,畢竟SPSS也是主要分析資料的一個軟體,那麼在相關分析的這裡就凸顯了它的強大之處,您再次讀這篇文章《用Excel做資料間的相關系數》,會發現,Excel中的相關系數的分析隻是皮爾遜(Pearson)相關分析。而SPSS中包括了三種相關分析(Pearson/ Kendall’s tau-b / Spearman)。
世間萬物除了因果關系、共變關系還有相關關系。相關關系中分為正相關、負相關和不相關,展現在數字上就是[-1,1]。若想形象的表示兩種資料之間的關系,可以制作一個相關關系散點圖。相關還有偏相關,偏相關是指将其他變量影響予以排除,求兩個變量之間的關系。這些用SPSS軟體都能做到。
下面說一下這三種相關系數的特點。
1、Pearsoncorrelation coefficient皮爾遜相關系數
它是由卡爾·皮爾遜從弗朗西斯·高爾頓在19世紀80年代提出的一個相似卻又稍有不同的想法演變而來的。
該相關系數的前提條件最嚴格:
(1)成對資料;
(2)變量呈正态雙分布;
(3)兩列變量是連續變量;
(4)兩列變量之間的關系是線性關系;
(5)資料間的差距不能太大。
是以我們用pearson相關系數之前要進行資料正态驗證。
2、Kendall’stau-b correlation coefficient 肯德爾相關系數
它是一種秩相關系數,也就說它是做按順序排列的資料相關分析,而且分析的對象是分類變量,比如說人的帥氣程度(很帥、帥、一般帥、不帥),沒有皮爾遜相關系數的那麼多前提條件。
3、Spearman correlation coefficient 斯皮爾曼相關系數
由英國心理學家、統計學家斯皮爾曼根據積差相關的概念推導而來。它也是分析有順序的資料相關性,有線性關系的資料,沒有皮爾遜相關系數的那麼多前提條件的限制。
是以說不是正态分布的資料,可以用後兩種相關系數進行分析。
示範一下SPSS怎麼操作
打開軟體自帶的資料集employee data,我們要分析初始工資和目前工資的相關性。
1、我們首先看一下他們的資料是否呈正态性
這裡用到非參數檢驗(Nonparametric tests),即在總體方差未知或知道甚少的情況下,利用樣本資料對總體分布形态等進行推斷的方法。其實也可以用其他方式進行正态檢驗,可參考下面參考文獻。
這裡就說一下非參數檢驗,如下圖,依次點選分析→非參數檢驗→舊對話框→1-樣本K-S,
這裡面有個正态檢驗,翻譯的是“正常”,這就是正态分布(Normal distribution),其他幾個叫均勻分布、泊松分布、指數分布。我們把初始工資和目前工資放到檢驗變量清單。
點選确定,出結果,發現p<0.05,不是正态分布。那我們就不能用皮爾遜相關系數了(實際上實驗資料一般與正态分布相差不大,可以用皮爾遜相關系數,這裡就用斯皮爾曼相關系數了)。
2、我們檢驗一下線性情況
這裡用到散點圖
如下圖,依次點選圖形→舊對話框→散點
選擇第一個簡單分布
将目前工資放入第一個Y軸,初始工資放入第二個X軸
可以點選标題,加标題
點選确定,出圖,發現初始工資和目前工資,它們之間是呈線性關系的。
3、進行相關分析
依次點選分析→相關→雙變量
把初始工資和目前工資放入變量内,選擇斯皮爾曼相關系數,雙尾檢驗,标記顯著性相關。
點選确定得到結果,發現他們的相關性是0.826,還是比較強相關的。
下面是一個補充内容,
距離的分析,
我們還是以初始工資和目前工資做分析。
如下圖依次點選分析→相關→距離
把初始工資和目前的工資放入變量,選擇變量間,相似性,點選确定。
出結果,相關性0.880
我們求一下皮爾遜相關系數,發現跟距離的一樣,可知,距離用的是皮爾遜方法。
參考文獻:
[1] 統計學三大相關系數,
https://blog.csdn.net/zxyscz/article/details/82014694
[2] 幾個相關系數:Pearson、Spearman、pointbiserialr、kendalltau,
https://blog.csdn.net/mmc2015/article/details/51942066
[3] kendall秩相關系數,
https://baike.baidu.com/item/kendall%E7%A7%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/6246854?fr=aladdin
[4] 皮爾遜相關系數,
https://baike.baidu.com/item/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/12712835?fr=aladdin
[5] spearman相關系數,
https://baike.baidu.com/item/spearman%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/7977847?fr=aladdin
[6] spss如何進行正态性檢驗
https://jingyan.baidu.com/article/e6c8503cb5fc7be54e1a1860.html
[7] 趙小軍,祁祿.SPSS資料分析:問題提出與執行個體導學[M].北京:中國水利水電出版社,2011。
歡迎讨論!
微信文章随筆,描述不當的地方,望指正!
若侵權,請聯系本人删除!
歡迎大家投科學相關的稿件。
愛生活,愛科學!