95% CI, 置信區間 Confidence Interval

什麼是置信區間

　　置信區間又稱估計區間，是用來估計參數的取值範圍的。常見的52%-64%，或8-12，就是置信區間（估計區間）。

置信區間的概述

1、對于具有特定的發生機率的随機變量，其特定的價值區間：一個确定的數值範圍（“一個區間”）。　　

2、在一定置信水準時，以測量結果為中心，包括總體均值在内的可信範圍。

3、該區間包含了參數θ真值的可信程度。　　

4、參數的置信區間可以通過點估計量構造，也可以通過假設檢驗構造。

關于置信區間的寬窄

　　窄的置信區間比寬的置信區間能提供更多的有關總體參數的資訊。

　　假設全班考試的平均分數為65分，則置信區間、間隔、寬窄度、表達的意思是：

　　0-100分 100 寬等于什麼也沒告訴你

　　30-80分 50 較窄你能估出大概的平均分了（55分）

　　60-70分 10 窄你幾乎能判定全班的平均分了（65分）

置信區間與置信水準、樣本量的關系

　　1、樣本量對置信區間的影響：在置信水準固定的情況下，樣本量越多，置信區間越窄。

　　執行個體分析：

　　經過實踐計算的樣本量與置信區間關系的變化表（假設定信水準相同）：

樣本量	置信區間	間隔	寬窄度
100	50%-70%	20	寬
800	56.2%－63.2%	7	較窄
1,600	57.5%-63%	5.5	較窄
3,200	58.5%-62%	3.5	更窄

　　由上表得出:

　　1、在置信水準相同的情況下，樣本量越多，置信區間越窄。

　　2、置信區間變窄的速度不像樣本量增加的速度那麼快，也就是說并不是樣本量增加一倍，置信區間也變窄一倍（實踐證明，樣本量要增加4倍，置信區間才能變窄一倍），是以當樣本量達到一個量時（通常是1,200，如上例三個國家各抽了1,200個消費者），就不再增加樣本了。

　　通過置信區間的計算公式來驗證置信區間與樣本量的關系

　　置信區間=樣本的推斷值±（可靠程度系數× ）

　　從上述公式中可以看出：

　　1、在其他因素不變的情況下，樣本量越多（大），置信區間越窄（小）。

　　2、置信水準對置信區間的影響：在樣本量相同的情況下，置信水準越高，置信區間越寬。

　　執行個體分析：

　　美國做了一項對總統工作滿意度的調查。在調查抽取的1,200人中，有60%的人贊揚了總統的工作，抽樣誤差為±3%，置信水準為95%；如果将抽樣誤差減少為±2.3%，置信水準降到為90%。則兩組數字的情況比較如下：

抽樣誤差	置信水準	置信區間	間隔	寬窄度
±3％	95％	60％±3％＝57％-63％	6	寬
±2.3％	90％	60％±2.3％＝57.7％-62.3％	4.6	窄

　　由上表得出:

　　在樣本量相同的情況下（都是1,200人），置信水準越高(95%)，置信區間越寬。

通俗的講：OR值是點估計，可信區間是區間估計。可信區間包含1，表示該因素對疾病的發生不起作用；可信區間大于1，表示該因素是一個“危險”因素。例如天氣預報預計在10-20\'C及15-16\'C之間（95%可行度），則後者較前者可信度高。實際測定若為15.5\'C,均落在2個可行度之間，說明可靠；若為25\'C,落95%可行度之外，說明不可靠，處于5%的幾率。95%上線位于左，下線位于右。

來源：http://wiki.mbalib.com/wiki/置信區間