天天看點

如何“準确分析”事後多重比較(post hoc test)

作者:崇文撰寫

基礎準備

  均值比較的假設檢驗是資料分析最重要的分析内容之一,根據參與比較的樣本數量不同,使用的假設檢驗方法也不同,做個簡要的總結:

  一個總體均值與一個常數進行比較(Z檢驗和T檢驗);

  兩個總體均值之間的比較(Z檢驗和T檢驗);

  三個及三個以上總體均值的比較(方差分析);

  與Z檢驗和T檢驗不同,方差分析的結果隻能檢驗出三個以上的總體均值是完全相同呢?還是不完全相同?注意是不完全相同,至于是哪個或哪些總體均值與其它總體均值不同則是不能獲知的。是以方差分析結束以後還需要做事後多重檢驗,分析出到底是哪個或哪些總體均值與衆不同。

  今天我們要介紹的是進行事後多重檢驗的方法介紹。如果對方差分析還不太熟悉的朋友可以點選下面的連結回顧:

  資料分析技術:方差分析原理;

  資料分析理論:方差分析模型;

  很多朋友會有疑問,為什麼方差分析一定要進行事後多重比較呢?直接用獨立樣本T檢驗進行多次兩兩比較不是也可以嗎?我們可以用一個例子說明這個原因:以方差分析為例,假如有5個樣本,如果要進行多次均值的兩兩比較,那麼兩兩比較的次數多達10次。設每次比較的顯著性水準等于0.05,那麼10次比較都不犯“棄真”錯誤的機率為(1-0.05)的十次方,也就是0.60左右,也就是說犯“棄真”錯誤的機率高達0.40,這遠遠大于原先設定的顯著性水準0.05。不僅如此,随着比較組數的增多,犯“棄真”錯誤的機率也會越來越大。

  SPSS的事後多重檢驗方法

  應用SPSS進行方差分析時,給分析者提供了很多事後多重檢驗的方法,如下圖所示。這些方法根據多個總體方差是否相等分成了兩大類。

如何“準确分析”事後多重比較(post hoc test)

  事後多重檢驗的方法很多,但并不是說它們如百花齊放般的襯托了統計學的欣欣向榮,而是說明到目前為止仍然沒有統一的解決方法,是以才根據不同的目的和資料情況創造出了很多不同的方法。

  兩兩比較的方法

  LSD法:最小顯著性差異法(Least Significance Difference),是最簡單的比較方法之一。它是t檢驗的一個簡單變形,并未對檢驗水準做出任何校正,隻是在标準誤(注意不是标準差)的計算上充分考慮了所有總體水準的樣本資訊,估計出了一個更為穩健的标準誤。因為單次比較的顯著性水準a保持不變,是以LSD法是最靈敏的事後多重比較法。

  Sidak法:Sidak校正在LSD法上的應用。通過Sidak校正降低每次兩兩比較的“棄真”錯誤機率,以使最終整個比較的“棄真”錯誤機率保持為顯著性水準a。這也就是說每次比較的顯著性水準a會随着比較次數的增多而減小。顯然,Sidak法比LSD法的靈敏度低。每次進行Sidak比較的顯著性水準為:

如何“準确分析”事後多重比較(post hoc test)

  Bonferroni法:與Sidak法類似,它的每一次比較實際上是Bonferroni校正在LSD法上的應用。Bonferroni法修正後每次比較的顯著性水準比Sidak法的更小,也就是說Bonferroni法比Sidak法的靈敏度更低。

如何“準确分析”事後多重比較(post hoc test)

  Scheffe法:Scheffe法的實質是對多個總體均值間的線性組合是否為0進行假設檢驗。多用在兩組樣本含量不同的情況。

  Dunnett法:常用于多個試驗組與一個對照組間的比較。是以在指定Dunnett法時,還應當指定對照組。

  以上五種方法的排列順序是按照靈敏度從高到低排列的,LSD法>Sidak法>Bonferroni法>Scheffe法>Dunnett法。

  形成同質亞組的方法

  SNK法:全稱為Student-Newman-Keuls法。它實質上是根據預先指定的準則将各組均值分為多個亞組,利用Studentized Range分布來進行假設檢驗,并根據所要檢驗的均值個數調整總的“棄真”錯誤機率不超過設定的顯著性水準a。

  Tukey法:全稱為Tukey' s Honestly Significant Difference法。應用這種方法要求各組樣本含量相同。它也是利用Studentized Range分布來進行各組均數間的比較,與SNK法不同地是,它控制所有比較中最大的“棄真”錯誤機率不超過設定的顯著性水準a。

  Duncan法:其思路與SNK法相類似,隻不過檢驗統計量服從的是Duncan' s Multiple Range分布。

  以上8種是常用的事後多重檢驗方法(各水準樣本的方差齊性),剩下的六種方法并不常用,這裡就不在介紹。除此之外,在各組樣本方差不齊時,SPSS還提供了4種事後多重檢驗的方法,但從方法的接受程度和結果的穩健性講,希望大家盡量不要在方差不齊時進行方差分析甚至兩兩比較,采用變量變換或者非參數檢驗往往更可靠。

如何“準确分析”事後多重比較(post hoc test)

繼續閱讀