定義掌握:
單個樣本的t檢驗
目的:比較樣本均數 所代表的未知總體均數μ和已知總體均數μ0。
計算公式:
t統計量:

自由度:v=n - 1
适用條件:
(1) 已知一個總體均數;
(2) 可得到一個樣本均數及該樣本标準誤;
(3) 樣本來自正态或近似正态總體。
t檢驗的步驟
1、建立虛無假設h0:μ1 =
μ2,即先假定兩個總體平均數之間沒有顯著差異;
2、計算統計量t值,對于不同類型的問題選用不同的統計量計算方法;
1)如果要評斷一個總體中的小樣本平均數與總體平均值之間的差異程度,其統計量t值的計算公式為:
2)如果要評斷兩組樣本平均數之間的差異程度,其統計量t值的計算公式為:
3、根據自由度df=n-1,查t值表,找出規定的t理論值并進行比較。理論值差異的顯著水準為0.01級或0.05級。不同自由度的顯著水準理論值記為t(df)0.01和t(df)0.05
4、比較計算得到的t值和理論t值,推斷發生的機率,依據下表給出的t值與差異顯著性關系表作出判斷。
t值與差異顯著性關系表
t
p值
差異顯著程度
差異非常顯著
差異顯著
t < t(df)0.05
p > 0.05
差異不顯著
5、根據是以上分析,結合具體情況,作出結論。
單因素方差分析的基本理論
與通常的統計推斷問題一樣,方差分析的任務也是先根據實際情況提出原假設h0與備擇假設h1,然後尋找适當的檢驗統計量進行假設檢驗。本節将借用上面的執行個體來讨論單因素試驗的方差分析問題。
在上例中,因素a(即抗生素)有s(=5)個水準
,在每一個水準
下進行了nj =
4次獨立試驗,得到如上表所示的結果。這些結果是一個随機變量。表中的資料可以看成來自s個不同總體(每個水準對應一個總體)的樣本值,将各個總體的均值依次記為
,則按題意需檢驗假設
不全相等
為了便于讨論,現在引入總平均μ
其中:
再引入水準aj的效應δj
顯然有
,δj表示水準aj下的總體平均值與總平均的差異。
利用這些記号,本例的假設就等價于假設
不全為零
是以,單因素方差分析的任務就是檢驗s個總體的均值μj是否相等,也就等價于檢驗各水準aj的效應δj是否都等于零。
2. 檢驗所需的統計量
假設各總體服從正态分布,且方差相同,即假定各個水準
下的樣本
來自正态總體n(μj,σ2),μj與σ2未知,且設不同水準aj下的樣本之間互相獨立,則單因素方差分析所需的檢驗統計量可以從總平方和的分解導出來。下面先引入:
水準aj下的樣本平均值:
資料的總平均:
總平方和:
總平方和st反映了全部試驗資料之間的差異,是以st又稱為總變差。将其分解為
st = se + sa
其中:
上述se的各項
表示了在水準aj下,樣本觀察值與樣本均值的差異,這是由随機誤差所引起的,是以se叫做誤差平方和。sa的各項
表示了在水準aj下的樣本平均值與資料總平均的差異,這是由水準aj以及随機誤差所引起的,是以sa叫做因素a的效應平方和。
可以證明sa與se互相獨立,且當
為真時,sa與se分别服從自由度為s ?
1,n ? s的χ2分布,即
sa /
σ2?χ2(s ? 1)
se /
σ2?χ2(n ? s)
于是,當
為真時
這就是單因素方差分析所需的服從f分布的檢驗統計量。
3. 假設檢驗的拒絕域
通過上面的分析可得,在顯著性水準α下,本檢驗問題的拒絕域為
為了友善分析比較,通常将上述分析結果編排成如下表所示的方差分析表。表中的
分别稱為sa,se的均方。
方差來源
平方和
自由度
均方
f比
因素a
sa
s ? 1
誤差
se
n ? s
總和
st
n ? 1
假設檢驗是圍繞對原假設内容的審定而展開的。如果原假設正确我們接受了(同時也就拒絕了備擇假設),或原假設錯誤我們拒絕了(同時也就接受了備擇假設),這表明我們作出了正确的決定。但是,由于假設檢驗是根據樣本提供的資訊進行推斷的,也就有犯錯誤的可能。有這樣一種情況,原假設正确,而我們卻把它當成錯誤的加以拒絕。犯這種錯誤的機率用α表示,統計上把α稱為假設檢驗中的顯著性水準,,也就是決策中所面臨的風險。
顯著性水準是假設檢驗中的一個概念,是指當原假設為正确時人們卻把它拒絕了的機率或風險。它是公認的小機率事件的機率值,必須在每一次統計檢驗之前确定,通常取α=0.05或α=0.01。這表明,當作出接受原假設的決定時,其正确的可能性(機率)為95%或99%。
顯著性水準代表的意義是在一次試驗中小機率事物發生的可能性大小。