資料分析(1)——統計學中的各種分布
- 1. 離散機率分布
-
- 1.1 二項分布
-
- 1.1.1 二項分布的定義及其公式
- 1.1.2 二項分布的性質(适用情況)
- 1.1.3 例題
- 1.2 伯努利分布
-
- 1.2.1 伯努利分布的定義及其公式
- 1.2.2 伯努利分布的适用情況(舉例)
- 1.3 幾何分布
-
- 1.3.1 幾何分布的定義和公式
- 1.3.2 幾何分布的适用情況(與二項分布的差別)
- 1.3.3 幾何分布的題目
- 1.4 泊松分布
-
- 1.4.1 泊松分布的定義和公式
- 1.4.2 泊松分布的性質
- 1.4.3 泊松分布的适用情況(例題)
- 2 連續機率分布
-
- 2.1 指數分布
-
- 2.1.1 指數分布定義和公式
- 2.1.2 指數分布适用情況
- 2.1.3 指數分布與泊松分布的差別
- 2.2 均勻分布
-
- 2.2.1 均勻分布的公式
- 2.3 正态分布(高斯分布)
-
- 2.3.1 正态分布定義及公式
- 2.3.2 正态分布的特征
- 2.3.3 正态分布的性質
- 小結
1. 離散機率分布
1.1 二項分布
1.1.1 二項分布的定義及其公式
① 定義:在給定每次實驗的成功機率p、實驗次數n的情況下,成功數x的頻數分布。
在二項分布中,關注的是在n次試驗中成功出現的次數。
② 二項分布的機率函數:

③ 二項分布的數學期望和方差:
1.1.2 二項分布的性質(适用情況)
① 實驗由一系列相同的n個實驗組成
② 每次實驗都有兩種可能結果,及成功和失敗
③ 每次實驗成功的機率相同,用p表示,失敗機率則為1-p
④ 實驗都是互相獨立的
1.1.3 例題
如果連結點選轉換為購買的機率為0.02,那麼觀測到200次點選但沒有購買的機率?
解答:
- 題為求200次沒有成功的機率(1-200次中成功一次的機率),服從二項分布
- p = 0.02 , n= 200, x = 1
- 觀測到200次點選但沒有購買的機率為:
資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結
1.2 伯努利分布
1.2.1 伯努利分布的定義及其公式
① 定義:在二項分布n=1時的特例,一次随機實驗,成功的機率為p,失敗的機率為q=1-p,成功的次數也隻有0和1兩種情況。
② 機率密度:
③ 期望和方差:
1.2.2 伯努利分布的适用情況(舉例)
抛硬币(正反)、檢測産品(合格 不合格)、買彩票(中獎 未中獎)
1.3 幾何分布
1.3.1 幾何分布的定義和公式
① 定義:在重複多次的伯努利實驗中,實驗進行到某種結果出現第一次為止,此時的實驗總次數符合幾何分布。
② 機率密度:
其中,p為成功的機率,即為了在第x次嘗試取得第1次成功,首先要失敗(x-1)次。
③ 期望和方差:
1.3.2 幾何分布的适用情況(與二項分布的差別)
二項分布關注“n次實驗中成功x的機率”,幾何分布關注“第x嘗試取得第1次成功的機率”。
1.3.3 幾何分布的題目
例:一位滑雪者不出意外順利滑至坡底的機率為0.4,求
① 前10次滑雪失敗,第11次成功的機率
② 第4次或者不足4次就成功的機率
③ 4次以上才能成功的機率
解答:
① 前10次滑雪失敗,第11次成功的機率:
② 第4次或者不足4次就成功的機率:
③ 4次以上才能成功的機率:
1.4 泊松分布
1.4.1 泊松分布的定義和公式
① 定義:機關時間内或者機關空間中事件數量的頻數分布
② 機率密度:
其中,泊松分布的參數λ是機關時間(機關面積)内随機事件的平均發生次數。
③ 期望和方差:λ
④ 分布圖:
1.4.2 泊松分布的性質
① 在任意兩個相等長度的區間上,事件發生的機率相等。
② 事件在某一區間上是否發生與事件在其他區間是否發生是獨立的。
1.4.3 泊松分布的适用情況(例題)
如:一小時内到達候車廳的人數、10英裡長的高速路上需要維修的路段數目
工作日早上15min内到達某銀行出納視窗的汽車數量:
曆史資料顯示,15min内到達車輛的平均數為10,求15min内恰好到達五輛車的機率。
解答:
2 連續機率分布
2.1 指數分布
2.1.1 指數分布定義和公式
① 定義:模組化各次事件之間的時間分布情況
② 機率密度函數:
③ 分布函數:
④ 期望與方差:
⑤ 分布圖:
2.1.2 指數分布适用情況
如:網站通路的時間間隔、汽車抵達收費站的時間間隔
2.1.3 指數分布與泊松分布的差別
泊松分布描述了每一區間中事件發生的次數,
指數分布描述了事件發生的時間間隔長度。
2.2 均勻分布
2.2.1 均勻分布的公式
① 定義:均勻分布也叫矩形分布,它是對稱機率分布,在相同長度間隔的分布機率是等可能的 。
② 機率密度:
③ 機率分布:
④ 期望和方差:
⑤ 分布圖:
2.3 正态分布(高斯分布)
2.3.1 正态分布定義及公式
① 定義:經常用在自然和社會科學來代表一個不明的随機變量,比如人的身高和體重、考試成績、科學測量、降雨量等,都近似正态分布。
② 機率密度:
當期望=0,方差=1時,為标準正态分布:
③ 分布圖:
2.3.2 正态分布的特征
① 正态曲線的最高點在均值處,均值還是分布的中位數和衆數
② 正态分布是對稱的
③ 标準差決定曲線的平坦程度,标準差越大,曲線越平坦
④ 正态随機變量的機率是由正态曲線下的面積給出
2.3.3 正态分布的性質
小結
- 在離散分布中,要區分二項分布與幾何分布的差別。
- 要明确知道各個分布的适用情況以及大概的分布圖示。