前言
關于統計的科學性,各種方法汗牛充棟。關于統計的藝術性,卻讓人覺得陽春白雪。我有一個樸素的信念,任何東西隻要是美的,就一定會被大家接受甚至吹捧。遂将《統計之美》閱讀主題和心得進行記錄。
第一章 統計與科學
1.1 随機的世界
打撞球的實體學家
- 在《三體》打撞球的例子中,有很多微小的影響進球的因素,如:空氣的阻力(影響因素小的忽略不計),極端的大風或者地震(發生的可能性極低)等。我們用什麼辦法處理這些因素呢?答案是:随機的方法。
- 當然我們這裡的随機不是真正的随機,是不超過實體意義的,是綜合了大量難以測量的确定性因素後的處理方式。
- 随機中隐含了不确定性,是指結果的不明确,但是可能性是存在統計規律的,是以不是不确定,也不是确定。
- 确定性:對誤差有着完全的認知,或指沒有疑惑的精神狀态。
- 不确定性:缺乏知識描述目前的情況或估計将來的結果(如《三體》中黑球飛出太陽系,毫無規律的,混亂不堪的世界。
- 随機性:事物固有模式和可預測性确實,但通常遵循某種機率分布。
上帝擲骰子嗎
- 關于上帝是不是擲骰子的讨論源于兩個學派的争論(決定論和量子力學),薛定谔方程中有個關鍵的波函數代表了随機性,這是對以牛頓為代表的決定論的颠覆。後來海森堡提出“測不準原理”,認為電子的位置與動量沒辦法同時精确觀測,其中一個越精确另一個不确定程度越大。這些“哥本哈根學派”的科學家學說現在仍然是主流。
- 像量子力學這樣的直接在實體規律的層面出現随機性是非常少見的,尤其因為我們能夠感受到的宏觀世界中,實體規律仍然被認為是确定的。
- 在“哥本哈根學派”打破舊體系之前,很少人相信實體規律中的随機性,但這100年來,不僅是實體領域,對于我們身處其中的社會規律,越來越多的人接受了随機性的假設,這也是很多社會科學的基石。
- “在終極的分歧中,一切知識都是曆史;在抽象的意義下,一切科學都是數學;在理性的判斷上,所有的判斷都是統計學。”
——C.R.勞
- 論定論:又稱拉普拉斯信條,是一種哲學立場,認為每個事件的發生,包括人類的認知、舉止、決定和行動,都有條件決定他的發生,而不是另外事件的發生。
- 量子力學:是實體學的分支,主要描述微觀事物。與相對論一起被稱為現代實體學的兩大支柱。
連環殺手的歸案
- 美劇《數字追兇》中,講了均勻和正常的差別
- 均勻分布和正态分布都屬于随機分布。但自然界中的正态分布更常見,本意是正常。
- 我們常常有的随機感本質上是均勻。
- 例子:我們醫院出生的小孩性别是一種自然界的随機,男女比例1:1,但是我們無法判斷下一個出生的小孩是男還是女
扔硬币的數學家們
- 扔硬币實驗(伯努利實驗):一種隻包含兩種結果的實驗。
- 根據經驗如果硬币是均勻的,那麼硬币正面朝上和反面朝上的可能性相同,均為0.5.
- 實驗表明,我們扔硬币的次數越多,則正反面朝上的機率趨近于0.5.
- 這就是著名的大數定律(伯努利定理):樣本數量越多,則其平均就越趨近于期望。
- 保險公司的經營就利用了大數定理。
1.2 認識機率
遊戲獎金的配置設定
- 通過遊戲獎金如何配置設定的問題,帕斯卡在信件交流中對獎金配置設定問題做出了解答,後世認為他在1654年正式創立了機率論。
- 機率論創立了之後一直持續發展,雖然當時沒有建立一套數學公理化體系,但是已經有了完整的數學基礎和計算方法,這一時期的機率論被稱為古典機率論。
- 對于大部分應用場景來說,古典機率論和現代機率論并沒有本質差別。
6連号和14連号
- 連号問題可以被描述成,從N個連續的數中等機率的抽取m個數,求不少于k個數字相連的機率。進而把它簡化為機率組合問題。
- 從N個數中抽取m個數,共有