一種現象的發展變化必然受與之相聯系的其他現象發展變化的制約和影響。在統計學中,這種依存關系可以分成相關關系和回歸函數關系。
(1)相關關系
現象之間存在着非嚴格、不确定的依存關系。
特點:某一現象在數量上發生變化會影響另一現象數量上的變化,而且這種變化在數量上具有一定的随機性。
例如:影響銷售額的因素除了推廣費用外,還有産品品質、價格、管道等因素。
(2)回歸函數關系
指現象之間存在依存關系。
對于某一變量的每一個數值,都有另一個變量值與之相對應。
可用 數學表達式 反映出來。
什麼相關分析?
相關分析是研究兩個或兩個以上處于同等地位的随機變量間的相關關系的統計分析方法。例如,人的身高和體重之間;空氣中的相對濕度與降雨量之間的相關關系都是相關分析研究的問題。
相關分析與回歸分析之間的差別:回歸分析側重于研究随機變量間的依賴關系,以便用一個變量去預測另一個變量;相關分析側重于發現随機變量間的種種相關特性。
- 相關分析是基礎統計分析方法之一,它是研究兩個或兩個以上随機變量之間互相依存關系的方向和密切程度的方法。
- 相關分析目的:研究變量間的相關關系,通常與回歸分析等進階分析方法一起使用。
相關關系可分為:
線性相關——直線相關
非線性相關——曲線相關
相關分析
線性相關最常用的一種,當一個連續變量發生變動時,另一個連續變量相應地呈現關系變動,用皮爾遜(Pearson)相關系數 r 來度量。
皮爾遜相關系數 r 就是反應連續變量之間線性相關強度的一個度量名額。
在進行相關分析前,通常繪制散點圖來觀察變量間的相關性,如果這些變量在二維坐标中構成的資料點分布在一條直線的範圍,那麼就說明變量之間存線上性相關關系。
注意:
相關關系不等同于因果關系。
相關性關系:兩個變量同時變化
因果關系:一個變量導緻另一個變量變化
舉例
通過“超市銷售資料”案例學習如何用SPSS進行相關分析。
- 導入.sav資料
-
繪制散點圖
單擊【圖形】——【舊對話框】——【散點圖/點圖】——【簡單散點圖】——【定義】
彈出的【簡單散點圖】對話框中,将“廣告費用”變量移至【X軸】框中,将“銷售額”變量移至【Y軸】框中——【确定】
銷售額與廣告費用關系散點圖: 從圖中可以看出,兩個變量之間存在明顯的線性正相關關系,“銷售額”随着廣“廣告費用”的增加而相應增加。
相關分析操作
單擊【分析】——【相關】——【雙變量】——【雙變量相關性】
将“廣告費用”、“銷售額”兩個變量移至右側的【變量】中,這兩個變量均是連續變量,,保持【相關系數】框中預設勾選的【皮爾遜】複選框,其它選項都保持預設設定,單擊【确定】按鈕,即出相關分析結果。
從圖中可以看到廣告費用和銷售額的皮爾遜相關性 r = 0.816 ,為高度正相關關系,顯著性(P值)=0.000<0.01 ,具有極其顯著的統計學意義,從實際意義來講,投入的廣告費用越多,銷售額也就相應越大。
我們來多驗證幾個變量:
廣告費用和客流量,客流量和銷售額變量之間的關系:
按照上面的步驟,将廣告費用、銷售額、客流量移至變量中
從表中可以看出,銷售額、廣告費用、客流量三個變量兩兩之間的相關系數 r 都大于0.8 ,三個變量兩兩之間都具有高度正向相關關系,并且就有極其顯著的統計學意義。
再舉個例子:
某地區統計了機電行業的銷售額Y 和汽車産量 X(如表 所示),請使用 SPSS計算 Y 與 X 的相關系數。
操作步驟如下:
建立 SPSS 資料檔案;
【分析】——【相關】——【雙變量】——将銷售額與汽車移至【變量】中,直接單擊 确定 進行分析
從結果可以看出:
從銷售額Y與汽車産量的相關系數 r=0.901 , 為高度正相關關系,顯著性(P值)=0.000<0.01水準下線性關系顯著。
參考來源:
https://wenku.baidu.com/view/6cd0d05869d97f192279168884868762cbaebb4c.html
https://blog.csdn.net/qq_40605167/article/details/89277511
《誰說菜鳥不會資料分析-SPSS篇》