天天看點

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

資料分析(1)——統計學中的各種分布

  • 1. 離散機率分布
    • 1.1 二項分布
      • 1.1.1 二項分布的定義及其公式
      • 1.1.2 二項分布的性質(适用情況)
      • 1.1.3 例題
    • 1.2 伯努利分布
      • 1.2.1 伯努利分布的定義及其公式
      • 1.2.2 伯努利分布的适用情況(舉例)
    • 1.3 幾何分布
      • 1.3.1 幾何分布的定義和公式
      • 1.3.2 幾何分布的适用情況(與二項分布的差別)
      • 1.3.3 幾何分布的題目
    • 1.4 泊松分布
      • 1.4.1 泊松分布的定義和公式
      • 1.4.2 泊松分布的性質
      • 1.4.3 泊松分布的适用情況(例題)
  • 2 連續機率分布
    • 2.1 指數分布
      • 2.1.1 指數分布定義和公式
      • 2.1.2 指數分布适用情況
      • 2.1.3 指數分布與泊松分布的差別
    • 2.2 均勻分布
      • 2.2.1 均勻分布的公式
    • 2.3 正态分布(高斯分布)
      • 2.3.1 正态分布定義及公式
      • 2.3.2 正态分布的特征
      • 2.3.3 正态分布的性質
  • 小結

1. 離散機率分布

1.1 二項分布

1.1.1 二項分布的定義及其公式

① 定義:在給定每次實驗的成功機率p、實驗次數n的情況下,成功數x的頻數分布。

在二項分布中,關注的是在n次試驗中成功出現的次數。

② 二項分布的機率函數:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結
資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

③ 二項分布的數學期望和方差:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

1.1.2 二項分布的性質(适用情況)

① 實驗由一系列相同的n個實驗組成

② 每次實驗都有兩種可能結果,及成功和失敗

③ 每次實驗成功的機率相同,用p表示,失敗機率則為1-p

④ 實驗都是互相獨立的

1.1.3 例題

如果連結點選轉換為購買的機率為0.02,那麼觀測到200次點選但沒有購買的機率?
           

解答:

  • 題為求200次沒有成功的機率(1-200次中成功一次的機率),服從二項分布
  • p = 0.02 , n= 200, x = 1
  • 觀測到200次點選但沒有購買的機率為:
    資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

1.2 伯努利分布

1.2.1 伯努利分布的定義及其公式

① 定義:在二項分布n=1時的特例,一次随機實驗,成功的機率為p,失敗的機率為q=1-p,成功的次數也隻有0和1兩種情況。

② 機率密度:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

③ 期望和方差:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

1.2.2 伯努利分布的适用情況(舉例)

抛硬币(正反)、檢測産品(合格 不合格)、買彩票(中獎 未中獎)

1.3 幾何分布

1.3.1 幾何分布的定義和公式

① 定義:在重複多次的伯努利實驗中,實驗進行到某種結果出現第一次為止,此時的實驗總次數符合幾何分布。

② 機率密度:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

其中,p為成功的機率,即為了在第x次嘗試取得第1次成功,首先要失敗(x-1)次。

③ 期望和方差:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

1.3.2 幾何分布的适用情況(與二項分布的差別)

二項分布關注“n次實驗中成功x的機率”,幾何分布關注“第x嘗試取得第1次成功的機率”。

1.3.3 幾何分布的題目

例:一位滑雪者不出意外順利滑至坡底的機率為0.4,求
① 前10次滑雪失敗,第11次成功的機率
② 第4次或者不足4次就成功的機率
③ 4次以上才能成功的機率
           

解答:

① 前10次滑雪失敗,第11次成功的機率:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

② 第4次或者不足4次就成功的機率:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

③ 4次以上才能成功的機率:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

1.4 泊松分布

1.4.1 泊松分布的定義和公式

① 定義:機關時間内或者機關空間中事件數量的頻數分布

② 機率密度:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

其中,泊松分布的參數λ是機關時間(機關面積)内随機事件的平均發生次數。

③ 期望和方差:λ

④ 分布圖:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

1.4.2 泊松分布的性質

① 在任意兩個相等長度的區間上,事件發生的機率相等。

② 事件在某一區間上是否發生與事件在其他區間是否發生是獨立的。

1.4.3 泊松分布的适用情況(例題)

如:一小時内到達候車廳的人數、10英裡長的高速路上需要維修的路段數目

工作日早上15min内到達某銀行出納視窗的汽車數量:
曆史資料顯示,15min内到達車輛的平均數為10,求15min内恰好到達五輛車的機率。
           

解答:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

2 連續機率分布

2.1 指數分布

2.1.1 指數分布定義和公式

① 定義:模組化各次事件之間的時間分布情況

② 機率密度函數:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

③ 分布函數:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

④ 期望與方差:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結
資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

⑤ 分布圖:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

2.1.2 指數分布适用情況

如:網站通路的時間間隔、汽車抵達收費站的時間間隔

2.1.3 指數分布與泊松分布的差別

泊松分布描述了每一區間中事件發生的次數,

指數分布描述了事件發生的時間間隔長度。

2.2 均勻分布

2.2.1 均勻分布的公式

① 定義:均勻分布也叫矩形分布,它是對稱機率分布,在相同長度間隔的分布機率是等可能的 。

② 機率密度:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

③ 機率分布:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

④ 期望和方差:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

⑤ 分布圖:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

2.3 正态分布(高斯分布)

2.3.1 正态分布定義及公式

① 定義:經常用在自然和社會科學來代表一個不明的随機變量,比如人的身高和體重、考試成績、科學測量、降雨量等,都近似正态分布。

② 機率密度:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

當期望=0,方差=1時,為标準正态分布:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

③ 分布圖:

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

2.3.2 正态分布的特征

① 正态曲線的最高點在均值處,均值還是分布的中位數和衆數

② 正态分布是對稱的

③ 标準差決定曲線的平坦程度,标準差越大,曲線越平坦

④ 正态随機變量的機率是由正态曲線下的面積給出

2.3.3 正态分布的性質

資料分析(1)——統計學中的各種分布1. 離散機率分布2 連續機率分布小結

小結

  • 在離散分布中,要區分二項分布與幾何分布的差別。
  • 要明确知道各個分布的适用情況以及大概的分布圖示。

繼續閱讀