天天看點

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

目錄

1.随機事件和機率

1.1 排列、組合

1.2  事件基本計算

1.3古典型機率 (等可能概型)

1.4 幾何型機率

1.5條件機率

1.6全機率公式和貝葉斯公式(逆概公式)

2.一維随機變量及其分布

2.1随機變量

2.2 随機變量的分布函數

2.3連續型随機變量的機率分布

常見的連續性随機變量 

均勻分布 

正态分布(最最最最最重要!)

指數分布E(λ) 

 舉例

2.4 一維随機變量函數的分布

2.4.1離散型随機變量的函數分布

1.随機事件和機率

1.1 排列、組合

(1)排列公式:n個相異物體取r(1<=r<=n)個的不同排列總數

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

當n=r時,P=r(r-1)...1=r!,其中 0!=1

(2)組合公式:n個相異物件取r(1<=r<=n)個的不同組合總數。因為每一個包含r個物件的組合都可以産生r!個不同的排列,是以排列數應該是組合數的r!倍。

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

1.2  事件基本計算

交換律:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

 = 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

 = 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

結合律:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

;

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

配置設定律:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

;

德摩根律: 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

 。

  • 設A,B是兩個事件,若
    機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
    ,則有
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

;

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • (加法公式)對于任意兩事件A,B有 
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

           加法公式推廣:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

1.3古典型機率 (等可能概型)

樣本空間有限

  • 計算方法:
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

1.4 幾何型機率

各區域可能性相同

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • P=0的事件依舊有可能發生,p=1也不一定是必然事件

1.5條件機率

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

1.6全機率公式和貝葉斯公式(逆概公式)

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

全機率公式(先驗機率)

 貝葉斯公式(後驗機率)

2.一維随機變量及其分布

試驗E隻有兩種可能結果A或A逆,則稱E為伯努利試驗。

将E獨立重複進行N次,則稱為N重伯努利試驗。

2.1随機變量

  • 伯努利分布的三種情況
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • 泊松分布:x~p(λ)

随機變量X的可能取值為0,1,2,~,設随機變量X的機率分布為:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

(λ>0)

用于描述大量重複試驗中,稀有事件出現的頻數的機率分布情況的數學模型。

2.2 随機變量的分布函數

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

2.3連續型随機變量的機率分布

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

常見的連續性随機變量 

  • 均勻分布 

均勻機率分布(uniform probability distribution)是指連續随機變量所有可能出現值出現機率都相同。 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

均勻分布的機率分布,均值,方差和标準差: 

均值:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

方差:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

标準差:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

如何求解均值和标準差:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • 正态分布(最最最最最重要!)

正态分布是統計學中常見的一種分布,表現為兩邊對稱,是一種鐘型的機率分布(bell curve),其機率密度圖為:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

其中,

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

是正态随機變量的均值; 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

是标準差; 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

是圓周率,約等于3.1416··· ;e=2.71828⋅⋅⋅

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

=0。瘦成閃電

特别的,當

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

的正态分布,被稱為标準正态分布(standard distribution),上圖最後一個公式就是标轉化

正态分布來近似二項分布 :

當n足夠大的時候,正态分布對于離散型二項分布能夠很好地近似。 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

評價正态分布 :

如何來确定資料是否正态分布,主要有以下幾種方法: 

1. 圖形感受法:建立直方圖或者枝幹圖,看圖像的形狀是否類似正态曲線,既土墩形或者鐘形,并且兩端對稱。 

2. 計算區間

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

,看落在區間的百分比是否近似于68%,95%,100%。(切比雪夫法則和經驗法則) 

3. 求IQR和标準差s,計算IQR/s,如若是正态分布,則IQR/s≈1.3.

4. 建立正态機率圖,如果近似正态分布,點會落在一條直線上。 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • 指數分布E(λ) 

指數分布是描述泊松分布P(𝜆)中事件發生時間間隔的機率分布。除了用于蔔瓦松過程的分析,還有許多其他應用,如以下場景:

  • 世界杯比賽中進球之間的時間間隔
  • 超市客戶中心接到顧客來電之間的時間間隔
  • 流星雨發生的時間間隔
  • 機器發生故障之間的時間間隔
  • 癌症病人從确診到死亡的時間間隔
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

個别教科書中,參數為θ=1/λ,在機率密度函數和分布函數中做同樣的替換即可

指數分布有如下的适用條件: 

1. x是兩個事件發生之間的時間間隔,并且x>0; 

2. 事件之間是互相獨立的; 

3. 事件發生的頻率是穩定的; 

4. 兩個事件不能發生在同一瞬間。

這幾個條件實質上也是使用泊松分布的前提條件。如果滿足上述條件,則x是一個指數随機變量,x的分布是一個指數分布。如果不滿足上述條件,那麼需要使用Weibull分布或者gamma分布。

指數分布隻有一個參數,“λ”,λ是事件發生的頻率,在不同的應用場景中可能有不同名稱:

  • 事件頻率
  • 到達頻率
  • 死亡率
  • 故障率
  • 轉變率
  • …………

λ是單元時間内事件發生的次數,這裡需要注意的是,單元時間可以是秒,分,小時等不同的機關,同時λ根據單元時間度量的不同,其數值也不一樣。如單元時間為1小時,λ為6,則單元時間1分鐘,λ為6/60=0.1

指數分布的機率密度函數(probability density func,PDF)由λ和x(時間)構成:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

均值:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

方差:

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

 舉例

一個裝置出現多次故障的時間間隔記錄如下:

23, 261, 87, 7, 120, 14, 62, 47, 225, 71, 246, 21, 42, 20, 5, 12, 120, 11, 3, 14, 71, 11, 14, 11, 16, 90, 1, 16, 52, 95

根據上面資料,我們可以計算得到該裝置發生故障的平均時間是59.6小時,即機關小時時間内發生故障事件的次數為λ=1/59.6=0.0168。 

那麼該裝置在3天(72小時)内出現故障的機率是多大呢?即求P(x<72),這就需要計算指數分布的累積分布函數: 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

也即該裝置3天内出現故障的機率大于70%。

2.4 一維随機變量函數的分布

2.4.1離散型随機變量的函數分布

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

2.4.2連續型随機變量函數的機率密度

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

3.二維随機變量

3.1 二維随機變量及其分布

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

 3.1.1 邊緣分布函數

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  •  判斷X、Y的獨立性
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

3.1.2 二維離散型随機變量

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

無限可列多對:泊松分布,x y 取整數到無窮

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

3.1.3 二維連續型随機變量

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • 二維均勻分布

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
  • 二維正态分布 

機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量

該二維函數分布了,之後再補充

繼續閱讀