統計學方法選用指南：幫你告别選擇困難症！

兩組或多組計量資料的比較

1、兩組資料

（1）大樣本資料或服從正态分布的小樣本資料

若方差齊性，則作成組t檢驗
若方差不齊，則作t’檢驗或用成組的Wilcoxon秩和檢驗

（2）小樣本偏态分布資料，則用成組的Wilcoxon秩和檢驗

2、多組資料

若大樣本資料或服從正态分布，并且方差齊性，則作完全随機的方差分析。如果方差分析的統計檢驗為有統計學意義，則進一步作統計分析：選擇合适的方法（如：LSD檢驗，Bonferroni檢驗等）進行兩兩比較。

如果小樣本的偏态分布資料或方差不齊，則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義，則進一步作統計分析：選擇合适的方法（如：用成組的Wilcoxon秩和檢驗，但用Bonferroni方法校正P值等）進行兩兩比較。

分類資料的統計分析

1、單樣本資料與總體比較

（1）二分類資料

小樣本時：用二項分布進行确切機率法檢驗；
大樣本時：用U檢驗。

（2）多分類資料：用Pearson c2檢驗（又稱拟合優度檢驗）。

2、四格表資料

（1）n>40并且是以理論數大于5，則用Pearson c2

（2）n>40并且是以理論數大于1并且至少存在一個理論數<5，則用校正 c2或用Fisher’s 确切機率法檢驗

（3）n￡40或存在理論數<1，則用Fisher’s 檢驗

3、2×C表資料的統計分析

（1）列變量為效應名額，并且為有序多分類變量，行變量為分組變量，則行評分的CMH c2或成組的Wilcoxon秩和檢驗

（2）列變量為效應名額并且為二分類，列變量為有序多分類變量，則用趨勢c2檢驗

（3）行變量和列變量均為無序分類變量

n>40并且理論數小于5的格子數<行清單中格子總數的25%，則用Pearson c2
n￡40或理論數小于5的格子數>行清單中格子總數的25%，則用Fisher’s 确切機率法檢驗

4、R×C表資料的統計分析

（1）列變量為效應名額，并且為有序多分類變量，行變量為分組變量，則CMH c2或Kruskal Wallis的秩和檢驗

（2）列變量為效應名額，并且為無序多分類變量，行變量為有序多分類變量，作none zero correlation analysis的CMH c2

（3）列變量和行變量均為有序多分類變量，可以作Spearman相關分析

（4）列變量和行變量均為無序多分類變量

n>40并且理論數小于5的格子數<行清單中格子總數的25%，則用Pearson c2

n￡40或理論數小于5的格子數>行清單中格子總數的25%，則用Fisher’s 确切機率法檢驗

Poisson分布資料

1、單樣本資料與總體比較

（1）觀察值較小時：用确切機率法進行檢驗。

（2）觀察值較大時：用正态近似的U檢驗。

2、兩個樣本比較

用正态近似的U檢驗。配對設計或随機區組設計。

兩組或多組計量資料的比較

1、兩組資料

大樣本資料或配對內插補點服從正态分布的小樣本資料，作配對t檢驗
小樣本并且內插補點呈偏态分布資料，則用Wilcoxon的符号配對秩檢驗

2、多組資料

若大樣本資料或殘差服從正态分布，并且方差齊性，則作随機區組的方差分析。如果方差分析的統計檢驗為有統計學意義，則進一步作統計分析：選擇合适的方法（如：LSD檢驗，Bonferroni檢驗等）進行兩兩比較。

如果小樣本時，內插補點呈偏态分布資料或方差不齊，則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義，則進一步作統計分析：選擇合适的方法（如：用Wilcoxon的符号配對秩檢驗，但用Bonferroni方法校正P值等）進行兩兩比較。

分類資料的統計分析

1、四格表資料

b+c>40，則用McNemar配對 c2檢驗或配對邊際c2檢驗
b+c￡40，則用二項分布确切機率法檢驗

2、C×C表資料

配對比較：用McNemar配對 c2檢驗或配對邊際c2檢驗
一緻性問題（Agreement）：用Kap檢驗

兩個變量之間的關聯性分析

1、兩個變量均為連續型變量

小樣本并且兩個變量服從雙正态分布，則用Pearson相關系數做統計分析
大樣本或兩個變量不服從雙正态分布，則用Spearman相關系數進行統計分析

2、兩個變量均為有序分類變量

可以用Spearman相關系數進行統計分析

3、一個變量為有序分類變量，另一個變量為連續型變量

可以用Spearman相關系數進行統計分析

回歸分析

1、直線回歸

如果回歸分析中的殘差服從正态分布（大樣本時無需正态性），殘差與自變量無趨勢變化，則直線回歸（單個自變量的線性回歸，稱為簡單回歸），否則應作适當的變換，使其滿足上述條件。

2、多重線性回歸

應變量（Y）為連續型變量（即計量資料），自變量（X1，X2，…，Xp）可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正态分布（大樣本時無需正态性），殘差與自變量無趨勢變化，可以作多重線性回歸。

觀察性研究：可以用逐漸線性回歸尋找（拟）主要的影響因素
實驗性研究：在保持主要研究因素變量（幹預變量）外，可以适當地引入一些其它可能的混雜因素變量，以校正這些混雜因素對結果的混雜作用

3、二分類的Logistic回歸

應變量為二分類變量，自變量（X1，X2，…，Xp）可以為連續型變量、有序分類變量或二分類變量。

（1）非配對的情況：用非條件Logistic回歸

觀察性研究：可以用逐漸線性回歸尋找（拟）主要的影響因素
實驗性研究：在保持主要研究因素變量（幹預變量）外，可以适當地引入一些其它可能的混雜因素變量，以校正這些混雜因素對結果的混雜作用

（2）配對的情況：用條件Logistic回歸

觀察性研究：可以用逐漸線性回歸尋找（拟）主要的影響因素
實驗性研究：在保持主要研究因素變量（幹預變量）外，可以适當地引入一些其它可能的混雜因素變量，以校正這些混雜因素對結果的混雜作用

4、有序多分類有序的Logistic回歸

應變量為有序多分類變量，自變量（X1，X2，…，Xp）可以為連續型變量、有序分類變量或二分類變量。

觀察性研究：可以用逐漸線性回歸尋找（拟）主要的影響因素
實驗性研究：在保持主要研究因素變量（幹預變量）外，可以适當地引入一些其它可能的混雜因素變量，以校正這些混雜因素對結果的混雜作用

5、無序多分類有序的Logistic回歸

應變量為無序多分類變量，自變量（X1，X2，…，Xp）可以為連續型變量、有序分類變量或二分類變量。

觀察性研究：可以用逐漸線性回歸尋找（拟）主要的影響因素
實驗性研究：在保持主要研究因素變量（幹預變量）外，可以适當地引入一些其它可能的混雜因素變量，以校正這些混雜因素對結果的混雜作用

生存分析資料

要求資料記錄結局和結局發生的時間（如；死亡和死亡發生的時間）

用Kaplan-Meier方法估計生存曲線
大樣本時，可以壽命表方法估計
單因素可以用Log－rank比較兩條或多條生存曲線
多個因素時，可以作多重的Cox回歸

（1）觀察性研究：可以用逐漸線性回歸尋找（拟）主要的影響因素

（2）實驗性研究：在保持主要研究因素變量（幹預變量）外，可以适當地引入一些其它可能的混雜因素變量，以校正這些混雜因素對結果的混雜作用。

- END -

本文為轉載分享&推薦閱讀，若侵權請聯系背景删除

小編根據《大話統計學》整理了16張統計學學習圖譜，參照這些思維導圖，可以幫你捋清楚關于統計學的概念，以及這些概念之間錯綜複雜的關系，搞清楚這些，可以在工作中極大的幫助你們在遇到問題時，應用準确的統計方法去實施。

統計學方法選用指南：幫你告别選擇困難症！

繼續閱讀

第四章建立SAS報表

R語言一統計分析-學習記錄

用python進行統計分析

統計分析之聚類分析

典型相關分析原理（CCA）

圓頂礦床電子探針微圖的ArcGISTM鄰近度和聚類分析研究了來自具有潛在經濟價值的重稀土元素(HREE)和其他關鍵元素

老闆讓做利潤分析表，其實很簡單，這些都自帶函數公式，輸入資料自動統計分析，小夥伴們可以參考下#會計實操#會計#利潤#利潤

[整理] 利用R生成随機分布的…

多重共線性的診斷與對策

拓端tecdat|R語言代寫實作層次聚類模型

拓端tecdat|ggplot2如何在R語言代寫中繪制表格

logistics判别與線性模型中的問題

教你如何擷取R的幫助

執行能力--收尾項目

【統計分析】(task5) 金融量化分析與随機模拟（通過随機模拟估計看漲期權的報酬分布）

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案