天天看點

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

置信區間的建構

引言

上一章幫助我們利用樣本估計總體均值、方差或一定比例的精确值。但是你認為的樣本就一定準确(或者說無偏)嗎?這一章,另一種估計總體統計量的方法——置信區間,有其作用。

曼帝糖果公司用一個包含100粒糖球的樣本得出口味持續時間均值的點估計量為62.7分鐘,同時總體方差的點估計量為25分鐘。這是根據手頭證據有可能得出的最可靠的口味持續時間估計,可要是略有差池,那該怎麼辦?

我們确實取用了最具代表性的資料樣本,以此估計總體的主要統計量,如均值、方差、比例,這意味着超長效口香糖球的口味持續時間均值的點估計量是我們有可能給出的最佳估計。

但是有這樣2個問題:

  1. 我們依賴來自唯一的一個樣本的結果得出非常精确的估計。我們盡力讓它無偏了,使它具有代表性。但是它是不是能100%代表總體,我們沒有絕對的把握,原因很簡單——我們用的是樣本。
  2. 如果我們所用的樣本無偏,則這個估計量很可能接近總體的真值。問題是,多接近才算“夠接近”?

是以,與其給出一個精确值作為總體均值的估計值,不如采用另一種方法。我們可以指定某個區間——而不是用一個十分精确的時間長度,作為糖球口味持續時間的估計。例如,我們可以說:我們期望糖球的口味持續時間為55至65分鐘,這仍然會讓聽者覺得糖球口味持續時間接近1小時,但卻留有更大的誤差空間。确定空間的寬度取決于自己對結果有多大自信了。

置信區間

認識置信區間

此前,我們以樣本資料為基礎,利用點估計量估計了糖球口味持續時間的均值,通過點估計量,我們能夠給出糖球口味平均持續時間的非常精确的估計。下面這張圖展現了糖球樣本口味持續時間的分布。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

那麼,如果我們為總體均值指定一個區間,情況會怎麼樣呢?我們不指定一個确切的數值,而指定兩個數值—我們期望糖球口味持續時間介于這兩個數值之間。我們讓均值的點估計量處于這個區間的中央,并将這個區間的上下限設定為這個點估計量加上或減去某個誤差。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

選擇區間上下限是為了讓“總體均值介于a和b之間”這一結果具有特定機率。例如,你可能希望通過選擇a和b,使得該區間中包含總體均值的幾率為95%。也就是說,所選擇的a和b使得:

P ( a < μ < b ) = 0.95 P(a < \mu < b) = 0.95 P(a<μ<b)=0.95

我們用(a,b)表示這個區間,由于a和b的确切數值取決于你希望自己對于“該區間包含總體均值”這一結果具有的可信程度,是以,(a,b)被稱為置信區間。

那麼,我們如何求總體均值的置信區間?

求解置信區間四步驟
  1. 選擇總體統計量(是指希望用于建構置信區間的總體統計量)
  2. 求出其抽樣分布(上一章講過抽樣分布)
  3. 決定置信水準(你選擇的區間中包含該統計量的機率)
  4. 求出置信上下限(為了求出置信上下限,我們需要知道置信水準和抽樣分布)

第1步:選擇總體統計量

第1步是選取要為之建構置信區間的統計量,這取決于要解決的實際問題。

在我們的執行個體中,需要為口香糖球口味持續時間的均值建構一個置信區間,于是就需要為總體均值 μ \mu μ建構一個置信區間。

第2步:求出所選統計量的抽樣分布

為了求出總體均值的抽樣分布,我們需要知道均值的抽樣分布,即需要知道 X ‾ \overline{X} X的期望和方差以及其分布。(相當于“上一章樣本均值的機率”反過來,這次我們已知的是樣本均值的機率,要求的是總體均值和方差)

讓我們先求期望和方差。回顧上一章的内容,我們知道均值的抽樣分布(概念:利用從所有可能樣本得出的所有樣本均值形成一個分布)的期望和方差為:

E ( X ‾ ) = μ V a r ( X ‾ ) = σ 2 n E(\overline{X}) = \mu \\ Var(\overline{X}) = \frac{\sigma^2}{n} E(X)=μVar(X)=nσ2​

為了利用以上結果求出 μ \mu μ的置信區間,我們代入總體方差的數值 σ 2 \sigma^2 σ2和樣本大小的數值n。但是我們不代入 μ \mu μ的數值,因為這是因為我們正在為這個數值求置信區間。( μ \mu μ為總體均值,我們在為它求置信區間)

原因(可能後面才能看懂):我們正在利用抽樣分布求 μ \mu μ的置信區間,是以,除了 μ \mu μ以外,我們代入所有數值。代入 σ 2 \sigma^2 σ2和n之後,就能用 X ‾ \overline{X} X的分布求出置信區間,我們很快就會進行說明。

但有一個問題——我們并不知道 σ 2 \sigma^2 σ2的真值,必須根據樣本進行估計。怎麼辦?

->利用點估計量

盡管我們不知道總體方差 σ 2 \sigma^2 σ2的真實值,卻可以用它的點估計量進行估計。于是我們代入 σ ^ 2 \hat{\sigma}^2 σ^2(總體方差的點估計量,概念見上一章),或者叫做 s 2 s^2 s2,而不是 σ 2 \sigma^2 σ2。(意思是用 σ ^ 2 \hat{\sigma}^2 σ^2大緻湊合一下當 σ 2 \sigma^2 σ2)

于是均值的抽樣分布的均值和方差等于:

E ( X ‾ ) = μ V a r ( X ‾ ) = s 2 n E(\overline{X}) = \mu \\ Var(\overline{X}) = \frac{s^2}{n} E(X)=μVar(X)=ns2​

(再重申一遍: s 2 s^2 s2是方差的點估計量。我們不知道總體方差的真實值是多少,于是用樣本方差進行估計。)

曼帝糖果公司用包含100顆糖球的樣本計算估計值,并算得 s 2 = 25 s^2=25 s2=25,于是:

V a r ( X ‾ ) = s 2 n = 25 / 100 = 0.25 Var(\overline{X})=\frac{s^2}{n} = 25/100 = 0.25 Var(X)=ns2​=25/100=0.25

除此之外,我們還需要清楚地知道 X ‾ \overline{X} X的分布。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

第3步:決定置信水準

置信水準表明你希望自己對于“置信區間包含總體統計量”這一說法有多大把握。例如,假設我們希望總體均值的置信水準為95%,這表示總體均值處于置信區間中的機率為0.95。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構
注意:置信水準越高,區間越寬,置信區間包含總體統計量的幾率越大。

要選擇一個合理寬度的置信水準,既能保證較大的機率,又能讓區間足夠窄。否則舉個例子:我們可以說糖球口味持續時間的均值在0至3天之間,但你卻無法據此知道糖球口味實際上能持續多久。

第4步:求出置信上下限

最後一步是求a和b—置信區間的上下限,上下限指出一個範圍的左右邊界—均值有95%的機率落入這個範圍中。a和b的确切值取決于需要使用的抽樣分布以及需要具有的置信水準。

對于我們的執行個體,需要讓糖球口味持續時間均值具有95%的置信度,即, μ \mu μ位于我們求得的a和b之間的機率必須為0.95。我們還知道, X ‾ \overline{X} X符合正态分布,其中 X ‾ ~ N ( μ , 0.25 ) \overline{X}~N(\mu,0.25) X~N(μ,0.25)。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

利用 X ‾ \overline{X} X的分布我們可以求出a和b的值。即,我們可以利用 X ‾ ∼ N ( μ , 0.25 ) \overline{X} \sim N(\mu, 0.25) X∼N(μ,0.25)求出a和b,例如 P ( X ‾ < a ) = 0.025 P(\overline{X}<a) = 0.025 P(X<a)=0.025和 P ( X ‾ > b ) = 0.025 P(\overline{X} > b) = 0.025 P(X>b)=0.025。

由于 X ‾ \overline{X} X符合正态分布,是以我們可以用正态分布求置信區間。方法與前面講過的算法相似:算出标準分,查詢标準正态分布機率表,得出所需要的結果。

1 求Z

對 X ‾ \overline{X} X進行标準化。

Z = X ‾ − μ 0.25 , 其中 Z ∼ N ( 0 , 1 ) Z = \frac{\overline{X}-\mu}{\sqrt{0.25}}, 其中Z\sim N(0,1) Z=0.25

​X−μ​,其中Z∼N(0,1)

下面是經過标準化的置信區間圖形:

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

利用 P ( Z < z a ) = 0.025 P(Z < z_a) = 0.025 P(Z<za​)=0.025和 P ( Z > z b ) = 0.0255 P(Z > z_b) = 0.0255 P(Z>zb​)=0.0255可以求出 z a , z b z_a, z_b za​,zb​,它們是标準置信區間上下限。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

2 用 μ \mu μ改寫不等式

到此為止,我們得到 P ( − 1.96 < Z < 1.96 ) = 0.95 P(-1.96<Z<1.96) = 0.95 P(−1.96<Z<1.96)=0.95,即:

P ( − 1.96 < X ‾ − μ 0.5 < 1.96 ) = 0.95 P(-1.96 < \frac{\overline{X}-\mu}{0.5} < 1.96) = 0.95 P(−1.96<0.5X−μ​<1.96)=0.95

用 μ \mu μ改寫不等式,即可以得到 μ \mu μ的置信區間。

− 1.96 < X ‾ − μ 0.5 < 1.96 − 0.98 < X ‾ − μ < 0.98 X ‾ − 0.98 < μ < X ‾ + 0.98 -1.96 < \frac{\overline{X}-\mu}{0.5} < 1.96 \\ -0.98 < \overline{X}-\mu < 0.98 \\ \overline{X} - 0.98 < \mu < \overline{X} + 0.98 −1.96<0.5X−μ​<1.96−0.98<X−μ<0.98X−0.98<μ<X+0.98

3 最後求 X ‾ \overline{X} X的數值

寫出不等式後,我們就非常接近描述糖球典型口味持續時間的數值—— μ \mu μ的置信區間。即,我們使用:

P ( X ‾ − 0.98 < μ < X ‾ + 0.98 ) = 0.95 P(\overline{X}-0.98 < \mu < \overline{X}+0.98) = 0.95 P(X−0.98<μ<X+0.98)=0.95

下面是草圖:

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

那麼隻要求出 X ‾ \overline{X} X,就能得出置信上下限。

X ‾ \overline{X} X指的是樣本均值的分布,于是我們可以采用來自曼帝糖果公司樣本的 x ‾ \overline{x} x值(術語為:樣本均值)。

提示:這裡沒有替代使用,具體原因見後面的“問2”。 V a r ( X ‾ ) = σ 2 n Var(\overline{X}) = \frac{\sigma^2}{n} Var(X)=nσ2​中的 σ 2 \sigma^2 σ2是因為它是總體方差,利用總體方差點估計量 s 2 s^2 s2替代。
【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

這樣就求出了置信區間。在區間(61.72,63.68)中包含糖球口味持續時間總體均值的幾率是95%。

使用置信區間取代點估計量,給出了對糖球口味持續時間的準确而精确的估計,卻不必提到精确的數字——就算樣本有誤差也還有周旋餘地。

步驟總結

讓我們複習一下前面講過的置信區間的建構步驟。

首先選擇用于建構置信區間的總體統計量。我們需要求出糖球口味持續時間均值的置信區間,于是需要建構山的置信區間。

确定了用于建構置信區間的總體統計量後,接着求其抽樣分布。我們求得均值的抽樣分布的期望和方差,代入除M以外的各個統計量的數值,于是發現我們可以使用文的正态分布。

随後,我們确定了用于建構置信區間的置信水準——95%。

最後必須求出置信區間的置信上下限。我們利用置信水準和抽樣分布得出了合适的置信區間。

建構置信區間會反複使用相同步驟,是以可以作一些簡化,具體取決于所需要的置信水準和試驗統計量的分布。具體如下,隻需要檢視要求的總體估計量、總體分布以及各種條件,然後代入總體統計量或其估計量,就行了。數值c取決于置信水準。

【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構

上面的例題應該是第3種情況。

例題(代式子即可)
【讀書筆記->統計學】12-01 置信區間的建構-置信區間概念簡介置信區間的建構
問:之前求 X ‾ \overline{X} X的期望和方差的時候,為什麼代入 σ 2 \sigma^2 σ2的點估計量,卻不代入 μ \mu μ的點估計量?

答:由于我們需要求的正是 μ \mu μ的置信區間,是以不用 x ‾ \overline{x} x代替 μ \mu μ。我們需要求出含有 μ \mu μ的表達式,以便求出置信區間。

問:為什麼用 x ‾ \overline{x} x作為 X ‾ \overline{X} X的值?

答: X ‾ \overline{X} X的分布即均值的抽樣分布。它是這樣來的:從總體中取出每一個大小為n的可能樣本,然後用所有的樣本均值形成一個抽樣分布。

x ‾ \overline{x} x是來自樣本的特定均值,于是我們借助它求出置信區間。

問:置信區間和置信水準有何差別?

答:置信水準是“統計量處于置信區間之中”的機率,通常是一個百分數,例如95%。置信區間則給出了區間本身——數字實際範圍的上下限。

問:我們已經求得 μ \mu μ的95%置信區間為(61.72, 63.68),這究竟意味着什麼?

答:這意味着:如果你打算抽取大小相同的多個樣本,然後為所有這些樣本建構置信區間,則這些置信區間中有95%會包含總體均值的真實值。你由此知道,用這種方法建構的置信區間在95%的情況下都将包含總體均值。

問:是否所有的置信區間都基于正态分布?

答:并非如此。我們随後會講到基于其他分布的區間。

問:既然隻要在簡便算法中代入數值就行,為什麼講那麼多步驟呢?

答:講這些步驟是為了讓你看清楚問題本質,了解置信區間的建構過程。大多數時候,你隻要代入數值就行了。

問:使用置信區間時需要進行連續性修正嗎?

答:理論上是要的,不過實踐中常忽略不計,也就是說隻要在簡便算法中代入數值算出置信區間就行了。

繼續閱讀