天天看點

拓端tecdat|R語言輔導t檢驗和非正态性的魯棒性

t檢驗是統計學中最常用的檢驗之一。雙樣本t檢驗允許我們基于來自兩組中的每一組的樣本來測試兩組的總體平均值相等的零假設。

這在實踐中意味着什麼?如果我們的樣本量不是太小,如果我們的資料看起來違反了正常假設,我們就不應過分擔心。此外,出于同樣的原因,即使X不正常(同樣,當樣本量足夠大時),組均值差異的95%置信區間也将具有正确的覆寫率。當然,對于小樣本或高度偏斜的分布,上述漸近結果可能不會給出非常好的近似,是以類型1誤差率可能偏離标稱的5%水準。

現在讓我們用R來檢驗樣本均值分布(在重複樣本中)收斂到正态分布的速度。我們将模拟來自對數正态分布的資料 - 即log(X)遵循正态分布。我們可以通過從正态分布中取幂随機抽取來從此分布中生成随機樣本。首先,我們将繪制一個大的(n = 100000)樣本并繪制其分布以檢視它的外觀: 我們可以看到它的分布是高度偏斜的。從表面上看,我們會擔心對這些資料使用t檢驗,假設X是正态分布的。

拓端tecdat|R語言輔導t檢驗和非正态性的魯棒性

為了看看樣本的樣本分布,我們将選擇樣本大小為n,并從對數正态分布中重複繪制大小為n的樣本,計算樣本均值,然後繪制這些樣本均值的分布。以下顯示n = 3的樣本平均值的直方圖(來自10,000個重複樣本):

拓端tecdat|R語言輔導t檢驗和非正态性的魯棒性

樣本均值的分布,n = 3

這裡的采樣分布是傾斜的。如此小的樣本量,如果其中一個樣本從分布的尾部具有高值,則這将給出與真實均值相差很遠的樣本均值。如果我們重複,但現在n = 10: 它現在看起來更正常,但它仍然是偏斜的 - 樣本均值有時很大。請注意,x軸範圍現在更小 - 樣本均值的可變性現在小于n = 3。最後,我們嘗試n = 100:

拓端tecdat|R語言輔導t檢驗和非正态性的魯棒性
拓端tecdat|R語言輔導t檢驗和非正态性的魯棒性

現在樣本均值的分布(來自人口的重複樣本)看起來非常正常。當n很大時,即使我們的一個觀測結果可能位于分布的尾部,分布中心附近的所有其他觀測值也會保持平均值。這表明對于這個特定的X分布,t檢驗應該是正确的,n = 100 。檢查這種情況的更直接的方法是進行模拟研究,其中我們憑經驗估計t檢驗的1型錯誤率,在給定的n選擇下應用于該分布。

當然,如果X不是正态分布的,即使假設正态性的t檢驗的類型1錯誤率接近5%,測試也不會是最佳的。也就是說,将存在零假設的替代測試,其具有檢測替代假設的更大功率。