天天看点

《统计之美》阅读笔记(更新中....)

前言

关于统计的科学性,各种方法汗牛充栋。关于统计的艺术性,却让人觉得阳春白雪。我有一个朴素的信念,任何东西只要是美的,就一定会被大家接受甚至吹捧。遂将《统计之美》阅读主题和心得进行记录。

第一章 统计与科学

1.1 随机的世界

打台球的物理学家

 - 在《三体》打台球的例子中,有很多微小的影响进球的因素,如:空气的阻力(影响因素小的忽略不计),极端的大风或者地震(发生的可能性极低)等。我们用什么办法处理这些因素呢?答案是:随机的方法。

 - 当然我们这里的随机不是真正的随机,是不超过物理意义的,是综合了大量难以测量的确定性因素后的处理方式。

 - 随机中隐含了不确定性,是指结果的不明确,但是可能性是存在统计规律的,所以不是不确定,也不是确定。

 - 确定性:对误差有着完全的认知,或指没有疑惑的精神状态。

 - 不确定性:缺乏知识描述当前的情况或估计将来的结果(如《三体》中黑球飞出太阳系,毫无规律的,混乱不堪的世界。

 - 随机性:事物固有模式和可预测性确实,但通常遵循某种概率分布。

上帝掷骰子吗

 - 关于上帝是不是掷骰子的讨论源于两个学派的争论(决定论和量子力学),薛定谔方程中有个关键的波函数代表了随机性,这是对以牛顿为代表的决定论的颠覆。后来海森堡提出“测不准原理”,认为电子的位置与动量没办法同时精确观测,其中一个越精确另一个不确定程度越大。这些“哥本哈根学派”的科学家学说现在仍然是主流。

 - 像量子力学这样的直接在物理规律的层面出现随机性是非常少见的,尤其因为我们能够感受到的宏观世界中,物理规律仍然被认为是确定的。

 - 在“哥本哈根学派”打破旧体系之前,很少人相信物理规律中的随机性,但这100年来,不仅是物理领域,对于我们身处其中的社会规律,越来越多的人接受了随机性的假设,这也是很多社会科学的基石。

 - “在终极的分歧中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的判断上,所有的判断都是统计学。”

 ——C.R.劳

 - 论定论:又称拉普拉斯信条,是一种哲学立场,认为每个事件的发生,包括人类的认知、举止、决定和行动,都有条件决定他的发生,而不是另外事件的发生。

 - 量子力学:是物理学的分支,主要描述微观事物。与相对论一起被称为现代物理学的两大支柱。

连环杀手的归案

 - 美剧《数字追凶》中,讲了均匀和正常的区别

 - 均匀分布和正态分布都属于随机分布。但自然界中的正态分布更常见,本意是正常。

 - 我们常常有的随机感本质上是均匀。

 - 例子:我们医院出生的小孩性别是一种自然界的随机,男女比例1:1,但是我们无法判断下一个出生的小孩是男还是女

扔硬币的数学家们

 - 扔硬币实验(伯努利实验):一种只包含两种结果的实验。

 - 根据经验如果硬币是均匀的,那么硬币正面朝上和反面朝上的可能性相同,均为0.5.

 - 实验表明,我们扔硬币的次数越多,则正反面朝上的概率趋近于0.5.

 - 这就是著名的大数定律(伯努利定理):样本数量越多,则其平均就越趋近于期望。

 - 保险公司的经营就利用了大数定理。

1.2 认识概率

游戏奖金的分配

 - 通过游戏奖金如何分配的问题,帕斯卡在信件交流中对奖金分配问题做出了解答,后世认为他在1654年正式创立了概率论。

 - 概率论创立了之后一直持续发展,虽然当时没有建立一套数学公理化体系,但是已经有了完整的数学基础和计算方法,这一时期的概率论被称为古典概率论。

 - 对于大部分应用场景来说,古典概率论和现代概率论并没有本质区别。

6连号和14连号  

 - 连号问题可以被描述成,从N个连续的数中等概率的抽取m个数,求不少于k个数字相连的概率。从而把它简化为概率组合问题。

 - 从N个数中抽取m个数,共有

继续阅读