天天看點

統計學方法選用指南:幫你告别選擇困難症!

01

兩組或多組計量資料的比較

1、兩組資料

(1)大樣本資料或服從正态分布的小樣本資料

  • 若方差齊性,則作成組t檢驗
  • 若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗

(2)小樣本偏态分布資料,則用成組的Wilcoxon秩和檢驗

2、多組資料

若大樣本資料或服從正态分布,并且方差齊性,則作完全随機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。

如果小樣本的偏态分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。

02

分類資料的統計分析

1、單樣本資料與總體比較

(1)二分類資料

  • 小樣本時:用二項分布進行确切機率法檢驗;
  • 大樣本時:用U檢驗。

(2)多分類資料:用Pearson c2檢驗(又稱拟合優度檢驗)。

2、四格表資料

(1)n>40并且是以理論數大于5,則用Pearson c2

(2)n>40并且是以理論數大于1并且至少存在一個理論數<5,則用校正 c2或用Fisher’s 确切機率法檢驗

(3)n£40或存在理論數<1,則用Fisher’s 檢驗

3、2×C表資料的統計分析

(1)列變量為效應名額,并且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗

(2)列變量為效應名額并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗

(3)行變量和列變量均為無序分類變量

  • n>40并且理論數小于5的格子數<行清單中格子總數的25%,則用Pearson c2
  • n£40或理論數小于5的格子數>行清單中格子總數的25%,則用Fisher’s 确切機率法檢驗

4、R×C表資料的統計分析

(1)列變量為效應名額,并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗

(2)列變量為效應名額,并且為無序多分類變量,行變量為有序多分類變量,作none zero correlation analysis的CMH c2

(3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析

(4)列變量和行變量均為無序多分類變量

n>40并且理論數小于5的格子數<行清單中格子總數的25%,則用Pearson c2

n£40或理論數小于5的格子數>行清單中格子總數的25%,則用Fisher’s 确切機率法檢驗

03

Poisson分布資料

1、單樣本資料與總體比較

(1)觀察值較小時:用确切機率法進行檢驗。

(2)觀察值較大時:用正态近似的U檢驗。

2、兩個樣本比較

用正态近似的U檢驗。配對設計或随機區組設計。

04

兩組或多組計量資料的比較

1、兩組資料

  • 大樣本資料或配對內插補點服從正态分布的小樣本資料,作配對t檢驗
  • 小樣本并且內插補點呈偏态分布資料,則用Wilcoxon的符号配對秩檢驗

2、多組資料

若大樣本資料或殘差服從正态分布,并且方差齊性,則作随機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。

如果小樣本時,內插補點呈偏态分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:用Wilcoxon的符号配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。

05

分類資料的統計分析

1、四格表資料

  • b+c>40,則用McNemar配對 c2檢驗或配對邊際c2檢驗
  • b+c£40,則用二項分布确切機率法檢驗

2、C×C表資料

  • 配對比較:用McNemar配對 c2檢驗或配對邊際c2檢驗
  • 一緻性問題(Agreement):用Kap檢驗

06

兩個變量之間的關聯性分析

1、兩個變量均為連續型變量

  • 小樣本并且兩個變量服從雙正态分布,則用Pearson相關系數做統計分析
  • 大樣本或兩個變量不服從雙正态分布,則用Spearman相關系數進行統計分析

2、兩個變量均為有序分類變量

  • 可以用Spearman相關系數進行統計分析

3、一個變量為有序分類變量,另一個變量為連續型變量

  • 可以用Spearman相關系數進行統計分析

07

回歸分析

1、直線回歸

如果回歸分析中的殘差服從正态分布(大樣本時無需正态性),殘差與自變量無趨勢變化,則直線回歸(單個自變量的線性回歸,稱為簡單回歸),否則應作适當的變換,使其滿足上述條件。

2、多重線性回歸

應變量(Y)為連續型變量(即計量資料),自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正态分布(大樣本時無需正态性),殘差與自變量無趨勢變化,可以作多重線性回歸。

  • 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
  • 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

3、二分類的Logistic回歸

應變量為二分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。

(1)非配對的情況:用非條件Logistic回歸

  • 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
  • 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

(2)配對的情況:用條件Logistic回歸

  • 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
  • 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

4、有序多分類有序的Logistic回歸

應變量為有序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。

  • 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
  • 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

5、無序多分類有序的Logistic回歸

應變量為無序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。

  • 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
  • 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

08

生存分析資料

要求資料記錄結局和結局發生的時間(如;死亡和死亡發生的時間)

  • 用Kaplan-Meier方法估計生存曲線
  • 大樣本時,可以壽命表方法估計
  • 單因素可以用Log-rank比較兩條或多條生存曲線
  • 多個因素時,可以作多重的Cox回歸

(1)觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素

(2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用。

- END -

本文為轉載分享&推薦閱讀,若侵權請聯系背景删除

小編根據《大話統計學》整理了16張統計學學習圖譜,參照這些思維導圖,可以幫你捋清楚關于統計學的概念,以及這些概念之間錯綜複雜的關系,搞清楚這些,可以在工作中極大的幫助你們在遇到問題時,應用準确的統計方法去實施。

繼續閱讀