天天看點

假設檢驗 - 參數檢驗 非參數檢驗 - 置信區間

  1. 假設檢驗

    小機率事件和反證法的應用。

    H0:原假設

    H1:備選假設

    解釋:假設在H0前提下,我們得到目前手頭上的樣本,定義為一個機率事件,機率為α(0.05, 0.01, 0.001),是小機率事件。通過公式計算P值,P<α, 則确認我們得到目前手頭上的樣本是一個小機率事件,而小機率事件在一次試驗中是不可能發生的,但事實發生了,則原假設錯誤,接受備選假設。

    正經解釋:

    H0:隻存在抽樣誤差,不存在系統誤差

    H1: 存在抽樣誤差和系統誤差

    在隻存在抽樣誤差的前提下,我們得到目前樣本的機率為P,如果P<α,則證明不隻是存在抽樣誤差,還存在系統誤差。

在參數檢驗中,像t分數,F統計量,卡方統計量等,它的分布是什麼形式的,統計學家已經算出來。之是以有分布,是因為變異的存在,分布就是描述變異的規律。

Z分布是均值,率分布規律

T分布是均值差的分布規律

F分布是方差比的分布規律

x2是方差、實際頻數和理論頻數的分布規律

接着來:

1. 參數檢驗思想

以 t 分布為例,t 分布是說從均值為u, 方差為 sigma方的正态分布總體中,随機抽取樣本量為n的樣本,用均值差 / 标準誤,抽一次得到一個 t 分數,抽一萬次得到一萬個 t 分數(這隻是描述,實際密度函數是人家推導出來的),進而得到 t 分布規律。

這就是說,在隻有抽樣誤差的時候(因為這就是進行的反複抽樣,像正态分布是對樣本不停抽樣,計算均值一樣),95% 的 t 分數是( x1, x2)之間。

提前設定一個拒絕水準(也就是機率值),也就是犯錯機率,就是阿爾法,當 t 分數落到拒絕域對應的區間,我們認為隻有抽樣誤差的時候,我們認為 t 是不可能落在這個範圍。alpha這麼小,如果我們還犯錯,我們認了。

95%解釋:

  1. 在隻有抽樣誤差的時候,抽樣一百次,95個 t 分數是( x1, x2)之間。如果樣本 t 分數不屬于這95個之一,我們拒絕原假設。

95%置信區間:

在拒絕原價設的前提下,我們用固定的試驗方法做一百次試驗,計算100個計算區間,有95個包含總體均值。

其實這有兩個95%,第一個是拒絕原假設時,我們有5%幾率犯錯,第二個是在我們這次試驗中,我們計算出一個置信區間,也有5%幾率犯錯。

本文來自部落格園,作者:Iving,轉載請注明原文連結:https://www.cnblogs.com/SAS-T/p/15544948.html

繼續閱讀