假設檢驗 - 參數檢驗非參數檢驗 - 置信區間

2021-11-12 15:34:00

在參數檢驗中，像t分數，F統計量，卡方統計量等，它的分布是什麼形式的，統計學家已經算出來。之是以有分布，是因為變異的存在，分布就是描述變異的規律。

Z分布是均值，率分布規律

T分布是均值差的分布規律

F分布是方差比的分布規律

x2是方差、實際頻數和理論頻數的分布規律

接着來：

1. 參數檢驗思想

以 t 分布為例，t 分布是說從均值為u, 方差為 sigma方的正态分布總體中，随機抽取樣本量為n的樣本，用均值差 / 标準誤，抽一次得到一個 t 分數，抽一萬次得到一萬個 t 分數(這隻是描述，實際密度函數是人家推導出來的)，進而得到 t 分布規律。

這就是說，在隻有抽樣誤差的時候(因為這就是進行的反複抽樣，像正态分布是對樣本不停抽樣，計算均值一樣)，95% 的 t 分數是( x1, x2)之間。

提前設定一個拒絕水準(也就是機率值)，也就是犯錯機率，就是阿爾法，當 t 分數落到拒絕域對應的區間，我們認為隻有抽樣誤差的時候，我們認為 t 是不可能落在這個範圍。alpha這麼小，如果我們還犯錯，我們認了。

95%解釋：

95%置信區間：

在拒絕原價設的前提下，我們用固定的試驗方法做一百次試驗，計算100個計算區間，有95個包含總體均值。

其實這有兩個95%，第一個是拒絕原假設時，我們有5%幾率犯錯，第二個是在我們這次試驗中，我們計算出一個置信區間，也有5%幾率犯錯。

本文來自部落格園，作者：Iving，轉載請注明原文連結：https://www.cnblogs.com/SAS-T/p/15544948.html

繼續閱讀