天天看點

社會心理學随機抽樣解釋場景解釋進一步推導

場景

在看《社會心理學》第八版17頁的時候,上面寫道:

無論我們調查一個城市的人,還是整個國家的人,1200個随機取樣的個體都能使我們得以描述描述整個總體,而同時,我們有95%的把握認為該調查的誤差不超過3%,這是在太奇妙了!

那問題來了,上面加粗的那3個數字是怎麼來的呢?

解釋

在這裡,我們假設調查的内容是讓被調查對象擲一次硬币,回答正面還是反面。已知正面的機率 P 等于0.5(P(正面)=0.5)。這樣,我們有1000個調查對象就和自己擲這個硬币1000次是一樣的。這樣的誤差的分布就符合高斯分布,95%就出自高斯分布,詳細解釋請參考這裡和這裡。但是,我們都知道,擲1次硬币的擲1000次硬币相比,肯定是擲1000次硬币正面朝上的機率 P′(正面) 更接近 P(正面) 的,那麼現在我們又引入了另一個概念,置信區間,用來衡量樣本統計的可信度,如果對細節沒興趣的話,到這裡我們就能從置信區間的定義中得出1200和3%剩下這兩個數字的由來的。

進一步推導

投一次硬币的平均值為 P ;

投一次硬币的方差為P(1−P);

投一次硬币的标準差為 P(1−P)−−−−−−−−√ ;

設投了N次硬币,置信區間公式為 CI=1.96∗σ/N−−√ ;

是以 N=(1.96∗σ/CI)2 ,因為 σ 最大值的時候是 P=0.5 ,是以 (1.96∗0.5/0.03)2≈1200

至于 1.96 是怎麼來的,我能說玄學嗎,具體可以看這裡

雖然我數學菜得不行,但是因為網上搜沒有把統計和《社會心理學》結合起來的,是以就在這裡抛磚引玉,發現錯誤的歡迎斧正。