01
兩組或多組計量資料的比較
1、兩組資料
(1)大樣本資料或服從正态分布的小樣本資料
- 若方差齊性,則作成組t檢驗
- 若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗
(2)小樣本偏态分布資料,則用成組的Wilcoxon秩和檢驗
2、多組資料
若大樣本資料或服從正态分布,并且方差齊性,則作完全随機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
如果小樣本的偏态分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
02
分類資料的統計分析
1、單樣本資料與總體比較
(1)二分類資料
- 小樣本時:用二項分布進行确切機率法檢驗;
- 大樣本時:用U檢驗。
(2)多分類資料:用Pearson c2檢驗(又稱拟合優度檢驗)。
2、四格表資料
(1)n>40并且是以理論數大于5,則用Pearson c2
(2)n>40并且是以理論數大于1并且至少存在一個理論數<5,則用校正 c2或用Fisher’s 确切機率法檢驗
(3)n£40或存在理論數<1,則用Fisher’s 檢驗
3、2×C表資料的統計分析
(1)列變量為效應名額,并且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗
(2)列變量為效應名額并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗
(3)行變量和列變量均為無序分類變量
- n>40并且理論數小于5的格子數<行清單中格子總數的25%,則用Pearson c2
- n£40或理論數小于5的格子數>行清單中格子總數的25%,則用Fisher’s 确切機率法檢驗
4、R×C表資料的統計分析
(1)列變量為效應名額,并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗
(2)列變量為效應名額,并且為無序多分類變量,行變量為有序多分類變量,作none zero correlation analysis的CMH c2
(3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析
(4)列變量和行變量均為無序多分類變量
n>40并且理論數小于5的格子數<行清單中格子總數的25%,則用Pearson c2
n£40或理論數小于5的格子數>行清單中格子總數的25%,則用Fisher’s 确切機率法檢驗
03
Poisson分布資料
1、單樣本資料與總體比較
(1)觀察值較小時:用确切機率法進行檢驗。
(2)觀察值較大時:用正态近似的U檢驗。
2、兩個樣本比較
用正态近似的U檢驗。配對設計或随機區組設計。
04
兩組或多組計量資料的比較
1、兩組資料
- 大樣本資料或配對內插補點服從正态分布的小樣本資料,作配對t檢驗
- 小樣本并且內插補點呈偏态分布資料,則用Wilcoxon的符号配對秩檢驗
2、多組資料
若大樣本資料或殘差服從正态分布,并且方差齊性,則作随機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
如果小樣本時,內插補點呈偏态分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合适的方法(如:用Wilcoxon的符号配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
05
分類資料的統計分析
1、四格表資料
- b+c>40,則用McNemar配對 c2檢驗或配對邊際c2檢驗
- b+c£40,則用二項分布确切機率法檢驗
2、C×C表資料
- 配對比較:用McNemar配對 c2檢驗或配對邊際c2檢驗
- 一緻性問題(Agreement):用Kap檢驗
06
兩個變量之間的關聯性分析
1、兩個變量均為連續型變量
- 小樣本并且兩個變量服從雙正态分布,則用Pearson相關系數做統計分析
- 大樣本或兩個變量不服從雙正态分布,則用Spearman相關系數進行統計分析
2、兩個變量均為有序分類變量
- 可以用Spearman相關系數進行統計分析
3、一個變量為有序分類變量,另一個變量為連續型變量
- 可以用Spearman相關系數進行統計分析
07
回歸分析
1、直線回歸
如果回歸分析中的殘差服從正态分布(大樣本時無需正态性),殘差與自變量無趨勢變化,則直線回歸(單個自變量的線性回歸,稱為簡單回歸),否則應作适當的變換,使其滿足上述條件。
2、多重線性回歸
應變量(Y)為連續型變量(即計量資料),自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正态分布(大樣本時無需正态性),殘差與自變量無趨勢變化,可以作多重線性回歸。
- 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
- 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
3、二分類的Logistic回歸
應變量為二分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
(1)非配對的情況:用非條件Logistic回歸
- 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
- 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
(2)配對的情況:用條件Logistic回歸
- 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
- 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
4、有序多分類有序的Logistic回歸
應變量為有序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
- 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
- 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
5、無序多分類有序的Logistic回歸
應變量為無序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
- 觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
- 實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
08
生存分析資料
要求資料記錄結局和結局發生的時間(如;死亡和死亡發生的時間)
- 用Kaplan-Meier方法估計生存曲線
- 大樣本時,可以壽命表方法估計
- 單因素可以用Log-rank比較兩條或多條生存曲線
- 多個因素時,可以作多重的Cox回歸
(1)觀察性研究:可以用逐漸線性回歸尋找(拟)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以适當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用。
- END -
本文為轉載分享&推薦閱讀,若侵權請聯系背景删除
小編根據《大話統計學》整理了16張統計學學習圖譜,參照這些思維導圖,可以幫你捋清楚關于統計學的概念,以及這些概念之間錯綜複雜的關系,搞清楚這些,可以在工作中極大的幫助你們在遇到問題時,應用準确的統計方法去實施。