天天看點

《SPSS 統計分析從入門到精通(第2版)》一6.4 遊程檢驗

本節書摘來自異步社群《spss 統計分析從入門到精通(第2版)》一書中的第6章,第6.4節,作者 杜強 , 賈麗豔 , 嚴先鋒,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

spss 統計分析從入門到精通(第2版)

有時我們除了關心分布的形狀外,還希望知道樣本的随機性。因為如果樣本不是從總體中随機抽取的,那麼所做的任何推斷都可能變得毫無價值。在某些特殊的情況下,樣本随機性的重要程度會遠遠大于總體參數的重要程度。

遊程檢驗的目的,就是檢驗取值為二分類并且按某種順序(例如時間順序)排列的資料資料,是否确實是随機出現的。

所謂遊程,是指二分類變量有相同取值的幾個連續記錄。以投硬币試驗為例,假設以1表示正面,0表示反面,在進行了若幹次投擲後,将得到一個以1、0組成的資料序列,如11100110110001,最前面的三個1為一個遊程(run),遊程的長度為3;随後的兩個0為第二個遊程,遊程長度為2,依次類推,這個序列包含七個遊程。把出現1的次數記作n1,出現0的次數記作n2,則有n1+n2=n;遊程的個數記為r,它是遊程檢驗的基本統計量。

如果遊程的總數極少,就意味樣本内部存在着一定的趨勢或結構,這可能是由于觀察值之間是不獨立的,或者樣本是來自不同總體的,極端的資料序列可能是1111111100000000;若樣本中存在極大量的遊程,則可能有系統的短周期波動影響着觀察結果,同樣不能認為序列是随機的,極端的資料序列可能是1010101010101010。是以,出現太少或太多的遊程都表明相應變量值的出現不是随機的。

1.遊程統計量

《SPSS 統計分析從入門到精通(第2版)》一6.4 遊程檢驗

在遊程檢驗中,将樣本各個觀測歸屬于兩種類别之中,于是各觀測出現的分布服從二項分布;随着樣本量的增大,遊程個數r的分布近似服從于正态分布。

遊程檢驗的原假設為h0:檢驗變量的取值是随機出現的。根據統計量z的取值,與标準正态分布在特定顯著性水準下的取值比較,做顯著性檢驗,即可接受或推翻原假設。

2.遊程檢驗典型問題

(1)檢驗兩個總體的分布是否相同。将從兩個總體中獨立抽取的兩個樣本的觀察值混合後,記錄遊程個數,進行關于随機性的假設檢驗。

(2)檢驗樣本的随機性。将取自某一總體的樣本觀察值按照從小到大的順序排列,找出中位數(或平均數),把樣本分為大于和小于中位數的兩個部分,用由這兩個部分上下交錯形成的遊程個數來檢驗樣本是否是随機的。

本節利用投擲硬币20多次所得的資料,來驗證出現正面、背面的機率是否随機,出現正面記為1,出現背面記為0。所用資料來自随盤檔案“chapter 06投硬币試驗.sav”,資料格式如圖6-11所示。

《SPSS 統計分析從入門到精通(第2版)》一6.4 遊程檢驗

注意

資料輸入的順序不可以改變,否則會改變資料的遊程數,進而使得檢驗結果不可信。

本例檢驗的原假設是h0:出現正面、背面的機率是随機的;備擇假設是h1:出現正面、背面的機率不是随機的。

依次單擊菜單“分析→非參數檢驗→舊對話框→遊程…”,執行遊程檢驗過程,其主設定界面如圖6-12所示。

《SPSS 統計分析從入門到精通(第2版)》一6.4 遊程檢驗

1.參數設定

在左側的變量清單單擊選中“記錄”變量,單擊圖檔 59按鈕,将其指定為檢驗變量。

boll 檢驗變量清單:用于從左側的變量清單選入檢驗變量,且必須為數值型分類變量;若同時選入了多個,将分别單獨處理。

boll “割點”欄:設定把資料劃分為兩個類别的臨界點,有4種方式:中位數(預設選項);衆數;均值;設定,在後面的輸入框指定任意的臨界值。樣本取值小于此處選項的歸為一類,其他的歸為另一類;若選擇了多個“割點”,則每個待檢驗變量将分别對每個割點的取值單獨做一次統計檢驗。

單擊“選項”按鈕,将彈出如圖6-5所示的選項設定對話框;單擊“精确”按鈕,将彈出如圖6-6所示的精确檢驗設定對話框。其設定選項的含義和設定方法同前。

2.結果分析

《SPSS 統計分析從入門到精通(第2版)》一6.4 遊程檢驗

在圖6-12中,單擊“确定”按鈕運作,spss檢視器視窗的輸出表格如圖6-13所示。由于漸進顯著性的取值0.816>0.10,故不能否定零假設,即認為出現正面、背面的機率是随機的。

繼續閱讀