非參數檢驗是一個相當宏大的命題。由于實際情況的複雜多變,是以非參數檢驗包括了許多的各種各樣的檢驗方法。之前我們提過,參數檢驗的使用條件是被檢驗的樣本總體服從正态分布,而非參數檢驗的使用條件自然就是總體不服從或不确定是否服從正态分布。(實際上,這裡要特别說明一下,盡管非參數檢驗的使用條件更寬松,但是考慮到精确性,不是特殊要求的話,我們還是盡可能的使用均值檢驗。)
比較常見的單樣本非參數檢驗包括遊程檢驗和單樣本k-s檢驗。
遊程檢驗:
它通常用于檢測兩個不同的觀測值出現的次序是否具有随機性。舉個例子,假如我們想知道每天來門診就診的人是否生病的次序是否随機,那麼我們就使用遊程檢驗。我們記錄下來個案依次是否生病,比如是為1,否為0。然後我們就有了一個由0和1構成的變量列,
我們選擇分析——非參數檢驗——舊對話框——遊程,在主面闆的檢驗變量清單裡選入我們的0,1變量列。頁籤裡邊選擇描述性,其他預設。割點可以全選。
輸出結果看p值就可以了(我真的不想再重複怎麼看p值了)。
單樣本k-s檢驗;
這個就比較重要了。這個檢驗的目的在于觀測樣本的分布。哦,想想也知道很重要。隻要我們想做相關和回歸,那我們就最好用k-s檢驗來檢查一下樣本的分布。畢竟pearson相關系數有效的一個重要條件就是樣本服從正态分布。
我們選擇分析——非參數檢驗——舊對話框——1樣本k-s,在主對話框的檢驗變量清單裡邊選入我們想檢驗分布的變量(比如一群病号的血細胞數),頁籤裡勾選描述性和四分位數,其他預設。在檢驗分布的下邊有四個供勾選的框框,這個要注意一下,正常指的就是正态分布,相等則是指均勻分布,勾選你想檢驗的分布(一般是正态分布)。确定以後就可以看結果了。
描述性統計量表會給你一些基本名額,幫助你感受這些資料。k-s檢驗表的p值會告訴你樣本是否服從指定的分布,如果是的話,表裡邊還有一些其他的名額可以參考。
單樣本非參數檢驗已經結束了(怎麼這麼少?),下邊我們說一下獨立樣本非參數檢驗。
兩獨立樣本非參數檢驗:
打開菜單分析——非參數檢驗——舊對話框——2個獨立樣本,在主面闆裡邊檢驗變量選入檢驗變量,分組變量選入分組變量,頁籤中選入描述性,四分位數,其他預設。在檢驗類型裡邊有四個供勾選的框框,我們一一學習。
mann-whitney 檢驗:
就是大名鼎鼎的秩和檢驗。
這個檢驗利用樣本觀察值得秩來推斷兩樣本所在總體的分布是否相同(不曉得什麼是秩的回去翻一遍你們的高數課本)。這是一個最常用的檢驗。舉例,假設我們知道一組患病的人和不患病的人的血細胞數,想檢查是否具有差異,那麼我們就使用秩和檢驗,我保證沒舉錯例子,這個例子确實也可以用獨立樣本t檢驗來做(希望大家還記得什麼叫獨立樣本t檢驗),當然也可以用秩和檢驗來做。
它會給出描述性統計量,秩表,檢驗統計量表。在最後的一個表裡邊我們通過p值判斷差異是否顯著。
moses極端反應檢驗:
它适用于實驗條件導緻兩個不同方向的極端反應情況(多用于醫學,比如有的藥物會導緻一部分病人好轉的同時也會導緻一部分病人惡化)。
它通過比較實驗組和觀察組,會告訴你是否産生了極端反應。(很神奇是不是?)
兩樣本k-s檢驗:
這個檢驗用來判斷兩個樣本的分布是否相同。也是看p值哈。
wald wolfowit遊程檢驗:
用來檢驗兩樣本是否來自相同的總體。
注意:k-s檢驗适用于數值變量資料或者有序分類資料。
多個獨立樣本非參數檢驗:
打開菜單分析——非參數檢驗——舊對話框——k 獨立檢驗,在主面闆的檢驗變量選入想檢驗的變量,分組變量選入分組變量。
檢驗類型有三種
k-w檢驗:
用來判斷各樣本分别代表的總體是否一緻,(相當于單因素方差分析),适用于數值變量和有序分類變量。結果會給出秩,檢驗統計量。通過p值判斷差異性。若想在進行兩兩比較,那就要用到上邊介紹的秩和檢驗來進行比較了。
中位數:
适用于數值變量資料。用來檢驗樣本代表的總體中位數是不是相等。這個用途還是比較廣泛的。
jonckheere-terpstra檢驗:
這個檢驗用來處理完全随機的資料,比如研究随着年齡增加,學習成績是否也增加?這種有序分組的變量就用這個檢驗來檢驗。(我真有點懶得介紹這麼冷門的檢驗的沖動,不過為了完整還是寫一下吧。)
兩相關樣本非參數檢驗:
打開兩個關聯樣本檢驗主面闆,檢驗對裡邊選擇兩個相關變量,檢驗類型有四種。
wilcoxon:
它用來檢驗兩個變量的分布是否有差異。比較常用。比如一種藥物治療前和治療後是否有差别?就用這個檢驗。
符号檢驗和wilcoxon差不多,也是檢查內插補點的。
mcnemar檢驗:
上邊兩個都是數值型的連續性資料,這個檢驗則用于配對計數資料,将兩組人進行配對,觀察他們的某個名額是否有差異。
邊際同質性檢驗是mcnemar檢驗的一般化和擴充,用于多分類配對計數資料。比如檢驗甲觀察的分類結果和乙觀察的分類結果是否有差異。(分好多類)
多個相關樣本非參數檢驗:
打開多個相關樣本檢驗主面闆,選入檢驗變量,檢驗類型一共有三種。
friedman檢驗:
用于檢驗多個相關樣本是否來自同一總體,是wilcoxon的擴充。
kendallw檢驗:
檢驗樣本的一緻性的好壞(不考慮分布的形狀,僅考慮分布是否一緻)。
cochran q檢驗:
用于二分資料時,是mcnemar檢驗的延伸,可以比較多個二分變量的比例的差異是否顯著。
非參數檢驗大概就是這些内容了。和參數檢驗一樣,這些檢驗的操作操作并不複雜,結果也不難判斷,學習的難點在于記住這些不同的檢驗方法的适用的不同範圍。需要多做一些練習,才可以鞏固掌握住非參數檢驗的内容。(我自己本身還是有點迷迷糊糊的,檢驗方法真的好多!!)