單樣本和兩樣本的統計推斷：置信區間和假設檢驗

《商務與經濟統計學》讀書筆記 6

1 相關概念

置信區間（confidence interval）：用一個區間範圍來估計總體參數，和點估計對比。
點估計：用一個數值來估計總體參數。
置信系數（confidence coefficient）：置信區間包含總體參數的機率。
置信水準（confidence level）：置信系數的百分比表示形式。
常見目标參數

參數	概念	資料類型
μ	均值；平均數	定量
p	比例；百分比	定性
σ2	方差；變異；散步	定量

2 置信區間—單樣本的統計推斷

2.1 大樣本置信區間：正太（ z ）統計量

單樣本和兩樣本的統計推斷：置信區間和假設檢驗

對于正太分布（z分布）的統計量， μ 在大樣本下（ 1−α ）的置信區間

α 已知：

x¯±zα/2σx=x¯±zα/2σn√

α 未知： x¯±zα/2σx=x¯±zα/2sn√

大樣本置信區間的條件：

1.目标總體中選擇一個随機樣本

2.樣本容量很大（ n≥30 ）。中心極限定理，保證了 x¯ 的抽樣分布近似正态分布。

2.2 小樣本置信區間：學生（ t ）統計量

單樣本和兩樣本的統計推斷：置信區間和假設檢驗

（t分布）的統計量， μ 在小樣本下（ 1−α ）的置信區間

α 已知：

x¯±tα/2σx¯=x¯±tα/2σn√

α 未知： x¯±tα/2σx=x¯±tα/2sn√

其中 tα/2 是基于 n−1 個自由度 t 分布中右尾面積α/2對應的 t 值。

小樣本置信區間的條件：

1.目标總體中選擇一個随機樣本

2.總體相對頻數分布近似于标準正态分布。

2.3 大樣本置信區間：總體比例（p）統計量

對于重複抽樣分布（ p^ 分布）的統計量， p 的大樣本下（1−α）的置信區間

p^±zα/2σp^=p^±zα/2pqn−−−√

說明：

1. p^ 的抽樣分布均值是 p ，p^是p的無偏估計值。

2. p^ 的抽樣分布标準差是 pq/n−−−−√ ，其中 q=1−p 。

3.對于大樣本， p^ 的抽樣分布是近似正太的，如果 np^≥15 和 nq^≥15 同時成立，樣本被視為大樣本。

大樣本置信區間的條件：

1.目标總體中選擇一個随機樣本

2.樣本容量很大（如果 np^≥15 和 nq^≥15 同時成立）。

p 值調整：

當p值接近1或者0時，大樣本的條件很難滿足，可以對總體比例進行調整。

總體比例 p 調整後的置信區間。

p˘±zα/2σp˘=p˘±zα/2p˘(1−p˘)n+4−−−−−−−−√

其中， p˘=x+2n+4 。

2.4 樣本量的确定

總體均值

根據 μ 的 1−α 置信區間确定樣本量

zα/2(σn√)=ME

則可以得到

n=(zα/2)2σ2ME2

總體比例

根據 p 的1−α置信區間确定樣本量

zα/2(pqn−−−√)=ME

則可以得到

n=(zα/2)2pqME2

2.5 總體方差 (σ2) 統計量: χ2 分布

單樣本和兩樣本的統計推斷：置信區間和假設檢驗

σ2的1−α 的置信區間

(n−1)s2χ2α/2≤σ2≤(n−1)s2χ2(1−α/2)

χ2α/2和χ2（1−α/2）代表自由度為 n−1 的卡方分布右尾和左尾面積為 α/2 所對應的值。

σ2 有效置信區間的條件：

1.從目标總體中選擇一個随機樣本。

2.總體的頻率分布近似正太。

3 假設檢驗—單樣本統計推斷

3.1檢驗統計量、拒絕域及 P 值

檢驗統計量和拒絕域

原假設(H0)： μ=μ0

備擇假設( Ha )： μ≠μ0

檢驗統計量: z=x¯−μσx¯=x¯−μσ/n√

單樣本和兩樣本的統計推斷：置信區間和假設檢驗

當 z 落在拒絕域時，我們認為這是一個小機率事件(p=α)，發生的可能性非常低，是以原假設不正确，因而拒絕原假設。

當 z 落在接受區域，則沒有充分的理由來拒絕原假設。（但是也沒有充分理由接受原假設）

此時涉及兩類錯誤：

第I類錯誤：H0為真的情況下拒絕原假設而接受備擇假設，犯第I類錯誤的機率為 α 。

第II類錯誤： H0 為假的情況下接受原假設，犯第II類錯誤的機率為 β 。

結論 H0 為真 Ha 為真

接受 H0 正确決定第II類錯誤（機率為 β ）

拒絕 H0 第I類錯誤（機率為 α ）正确決定

p 值：顯著性水準

1.計算z值， zp=x¯−μσx¯

2.如果是單側檢驗，那麼p值就是靠近備擇假設區域的面積。

如備擇假設是 > ，那麼p=P(z>zp)如備擇假設是 < <script id="MathJax-Element-88" type="math/tex"><</script>，那麼 p=P(z<zp) ;

3.如果是雙側檢驗，那麼那麼p值就是靠近備擇假設區域的面積的兩倍。

p=P(z>|zp|)

p 值作為檢驗結果的優勢：

1.p小于顯著水準 α ，那麼拒絕原假設。

2.可以通過 p 來确定能容忍的最大α值。

3.2 假設檢驗：正太（ z ）;學生（t）;比例（ p ）；總體方差

雙側檢驗：

統計量大樣本總體均值小樣本總體均值總體比例（p）總體方差分布正太（ z ）學生（t）（ p ） σ2 H0 μ=μ0 μ=μ0 p=p0 σ2=σ20 Ha μ≠μ0 μ≠μ0 p≠p0 σ2≠σ20 檢驗統計量 z=x¯−μ0σ/n√ t=x¯−μ0s/n√ z=p^−p0σp^=p^−p0p0q0/n√ χ2=(n−1)s2σ20 拒絕域 |z|>zα/2 |t|>tα/2 |z|>zα/2 χ2<χ2(1−α/2)
4 置信區間和假設檢驗—兩樣本的統計推斷

目标參數：

參數概念資料類型

μ1−μ2 均值差；平均上的差異定量

p1−p2 比例差；百分比差；比率差定性

σ21/σ22 方差比值；變異差異定量

4.1 大樣本總體均值

x1¯−x2¯ 抽樣分布性質

1. x1¯−x2¯ 的抽樣分布均值是 μ1¯−μ2¯ 。

2.如果兩個樣本互相獨立，抽樣分布的标準差：

σ(x¯1−x¯2)=σ21n1+σ22n2−−−−−−−−√

3.根據中心極限定理， x1¯−x2¯ 的抽樣分布在大樣本下近似服從正太分布。

獨立大樣本情況下 μ1−μ2 的置信區間：正太 z

(x1¯−x2¯)±za/2(σ(x1¯−x2¯)=(x1¯−x2¯)±za/2σ21n1+σ22n2−−−−−−−√≈(x1¯−x2¯)±za/2s21n1+s22n2−−−−−−−√

獨立大樣本情況下 μ1−μ2 的假設檢驗：正太 z

單側檢驗雙側檢驗

H0 μ1−μ2=D0 μ1−μ2=D0 Ha μ1−μ2<D0 （或 μ1−μ2>D0 ） μ1−μ2≠D0 檢驗統計量 z
z=(x1¯−x2¯)−D0σ(x¯1−x¯2)=(x1¯−x2¯)−D0σ21n1+σ22n2√≈(x1¯−x2¯)−D0s21n1+s22n2√ 拒絕域 z<−zα 或 z>zα |z|>zα/2 有效大樣本統計推斷條件 1.兩個樣本獨立的方式從總體中随機抽取

2樣本量 n1和n2 都很大。

4.2 小樣本總體均值

混合樣本估計量 s2p

1. σ2 混合樣本估計量表示為 s2p

s2p=(n1−1)s21+(n2−1)s22(n1−1)+(n2−1)=(n1−1)s21+(n2−1)s22(n1+n2−2)

獨立小樣本情況下 μ1−μ2 的置信區間：學生 t

(x1¯−x2¯)±ta/2s2p(1n1+1n2)−−−−−−−−−−√=(x1¯−x2¯)±ta/2(n1−1)s21+(n2−1)s22(n1+n2−2)(1n1+1n2)−−−−−−−−−−−−−−−−−−−−√

獨立小樣本情況下 μ1−μ2 的假設檢驗：正太 t

單側檢驗雙側檢驗

H0 μ1−μ2=D0 μ1−μ2=D0 Ha μ1−μ2<D0 （或 μ1−μ2>D0 ） μ1−μ2≠D0 檢驗統計量 t
t=(x1¯−x2¯)−D0s2p(1n1+1n2)√ 拒絕域 t<−tα 或 t>tα |t|>tα/2 有效大樣本統計推斷條件 1.兩個樣本獨立的方式從兩個目标總體中随機抽取

2兩個被抽樣的總體近似服從正态分布

3兩個總體具有相同的方差（ σ21=σ22 ）

若 σ21≠σ22 的情況

1. 樣本量相同（ n1=n2=n ）

置信區間: (x1¯−x2¯)±ta/2(s21+s22)/n−−−−−−−−−√

H0:μ1−μ2=0 下的檢驗統計量： t=(x1¯−x2¯)(s21+s22)/n−−−−−−−−−√

t 是基于自由度v=n1+n2−2=2(n−1)。

2. 樣本量不相同（ n1≠n2 ）

置信區間: (x1¯−x2¯)±ta/2(s21/n1+s22/n2)−−−−−−−−−−−−−√

H0:μ1−μ2=0 下的檢驗統計量： t=(x1¯−x2¯)(s21/n1+s22/n2)−−−−−−−−−−−−−√

t 是基于自由度v=(s21/n1+s22/n2)2(s21/n1)2n1−1+(s22/n2)2n2−1。

4.3 配對差異試驗
對于某些情況，由于某些原因不再符合獨立樣本，比如考察畢業生男生和女生工資薪酬均值差，如果是獨立樣本，結果可能因為專業和平均成績差異而變化比較大，是以可以根據專業和平均成績進行比對。

配對差異試驗的置信區間：
配對差異試驗 μd=(μ1−μ2) 的置信區間。

大樣本

d¯±zα/2σdnd√≈d¯±zα/2σdnd√

小樣本

d¯±tα/2σdnd√

其中， tα/2 是基于自由度為 nd−1 的。

配對差異試驗的假設檢驗：

單側檢驗雙側檢驗

H0 μd=D0 μd=D0

Ha μd<D0 （或 μd>D0 ） μd≠D0

大樣本

檢驗統計量 z z=d¯−D0σd/nd√≈d¯−D0sd/nd√

拒絕域 z<−zα 或 z>zα |z|>zα/2

有效大樣本統計推斷條件
1随機樣本內插補點是從兩個目标總體中随機抽取

2樣本量 nd 很大（ σ21=σ22 ）

小樣本

檢驗統計量 t t=d¯−D0sd/nd√

拒絕域 t<−tα 或 t>tα |t|>tα/2

有效小樣本統計推斷條件
1.随機樣本內插補點是從兩個目标總體中随機抽取

2總體差異近似服從正态分布

4.3 總體比例

p1^−p2^ 抽樣分布性質

1. p1^−p2^ 的抽樣分布均值是 p1−p2 。即：

E(p1^−p2^)=p1−p2

2.如果兩個樣本互相獨立，抽樣分布的标準差：

σ(p1^−p2^)=p1q1n1+p2q2n2−−−−−−−−−−−√

3.根據中心極限定理， p1^−p2^ 的抽樣分布在大樣本下近似服從正太分布。

獨立大樣本情況下 p1−p2 的置信區間：

(p1^−p2^)±za/2σ(p1^−p2^)=(p1¯−p2¯)±za/2p1q1n1+p2q2n2−−−−−−−−−√≈(p1^−p2^)±za/2p1^q1^n1+p2^q2^n2−−−−−−−−−√

獨立大樣本情況下 p1−p2 的假設檢驗：正太 z

單側檢驗雙側檢驗

H0 p1−p2=0 p1−p2=0

Ha p1−p2<0 （或 p1−p2>0 ） p1−p2≠0

檢驗統計量 z

z=(p1^−p2^)σ(x^1−x^2)=(p1^−p2^)p1q1n1+p2q2n2√≈(p1^−p2^)p1^q1^n1+p2^q2^n2√

拒絕域 z<−zα 或 z>zα |z|>zα/2

有效大樣本統計推斷條件 1.兩個樣本獨立的方式從總體中随機抽取

2樣本量 n1和n2 都很大（ n1p^1≥15,n2p^2≥15 ）。

4.4 樣本量确定

總體均值

根據 μ1−μ2 的 1−α 置信水準和誤差限 ME 确定樣本量

zα/2σ21n1+σ22n2−−−−−−−−√=ME

此時 n=n1=n2 則可以得到

n=(zα/2)2(σ21+σ212)ME2

總體比例

根據 p 的1−α置信區間确定樣本量

zα/2p1q1n1+p2q2n2−−−−−−−−−−−√=ME

此時 n=n1=n2 則可以得到

n=(zα/2)2(p1q1+p2q2)ME2

4.5 總體方差：兩樣本

獨立大樣本情況下相等方差的 F 假設檢驗：F

單側檢驗雙側檢驗

H0 σ21=σ22 σ21=σ22

Ha σ21<σ22或（σ21>σ22） σ21≠σ22

檢驗統計量 F F=s22s21（或F=s21s22） F=較大的樣本方差較小的樣本方差

拒絕域 F>Fα F>Fα/2

有效大樣本統計推斷條件
1.被抽樣的總體服從正态分布

樣本随機且獨立。

單樣本和兩樣本的統計推斷：置信區間和假設檢驗

1 相關概念

2 置信區間—單樣本的統計推斷

2.1 大樣本置信區間：正太（ z ）統計量

2.2 小樣本置信區間：學生（ t ）統計量

2.3 大樣本置信區間：總體比例（p）統計量

2.4 樣本量的确定

2.5 總體方差 (σ2) 統計量: χ2 分布

3 假設檢驗—單樣本統計推斷

3.1檢驗統計量、拒絕域及 P 值

3.2 假設檢驗：正太（ z ）;學生（t）;比例（ p ）；總體方差

4 置信區間和假設檢驗—兩樣本的統計推斷

4.1 大樣本總體均值

4.2 小樣本總體均值

4.3 配對差異試驗

4.3 總體比例

4.4 樣本量确定

4.5 總體方差：兩樣本

繼續閱讀

讀《Pragmatic Thinking and Learning》筆記及摘錄

浏覽<Pragmatic Thinking and Learning:Refactor Your “Wetware”>筆記

從0到1 zero to one大綱&摘錄大綱摘錄

讀《斷舍離》部分摘錄

資料分析實戰20絕技

算法圖解讀書筆記第8章貪婪算法

《算法圖解》讀書筆記

《啊哈！算法》讀書筆記

算法圖解讀書筆記第3章遞歸

從大資料看技術，為什麼天貓雙11是史上最大數字經濟節日

【讀書筆記】【linux kernel development】【從核心出發】

原則-讀書筆記-想要與事實的辨析和連接配接

《斷舍離》筆記二

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

投資學第二章 Asset Classes and Financial Instruments

投資學第一章 investments-introduction

結論	H0 為真	Ha 為真
接受 H0	正确決定	第II類錯誤（機率為 β ）
拒絕 H0	第I類錯誤（機率為 α ）	正确決定