目錄
1.随機事件和機率
1.1 排列、組合
1.2 事件基本計算
1.3古典型機率 (等可能概型)
1.4 幾何型機率
1.5條件機率
1.6全機率公式和貝葉斯公式(逆概公式)
2.一維随機變量及其分布
2.1随機變量
2.2 随機變量的分布函數
2.3連續型随機變量的機率分布
常見的連續性随機變量
均勻分布
正态分布(最最最最最重要!)
指數分布E(λ)
舉例
2.4 一維随機變量函數的分布
2.4.1離散型随機變量的函數分布
1.随機事件和機率
1.1 排列、組合
(1)排列公式:n個相異物體取r(1<=r<=n)個的不同排列總數

當n=r時,P=r(r-1)...1=r!,其中 0!=1
(2)組合公式:n個相異物件取r(1<=r<=n)個的不同組合總數。因為每一個包含r個物件的組合都可以産生r!個不同的排列,是以排列數應該是組合數的r!倍。
1.2 事件基本計算
交換律:
=
;
=
。
結合律:
;
。
配置設定律:
;
;
德摩根律:
;
。
- 設A,B是兩個事件,若 ,則有
機率論與數理統計1.随機事件和機率2.一維随機變量及其分布3.二維随機變量
;
- (加法公式)對于任意兩事件A,B有
加法公式推廣:
1.3古典型機率 (等可能概型)
樣本空間有限
- 計算方法:
1.4 幾何型機率
各區域可能性相同
- P=0的事件依舊有可能發生,p=1也不一定是必然事件
1.5條件機率
1.6全機率公式和貝葉斯公式(逆概公式)
全機率公式(先驗機率)
貝葉斯公式(後驗機率)
2.一維随機變量及其分布
試驗E隻有兩種可能結果A或A逆,則稱E為伯努利試驗。
将E獨立重複進行N次,則稱為N重伯努利試驗。
2.1随機變量
- 伯努利分布的三種情況
- 泊松分布:x~p(λ)
随機變量X的可能取值為0,1,2,~,設随機變量X的機率分布為:
(λ>0)
用于描述大量重複試驗中,稀有事件出現的頻數的機率分布情況的數學模型。
2.2 随機變量的分布函數
2.3連續型随機變量的機率分布
常見的連續性随機變量
-
均勻分布
均勻機率分布(uniform probability distribution)是指連續随機變量所有可能出現值出現機率都相同。
均勻分布的機率分布,均值,方差和标準差:
均值:
方差:
标準差:
如何求解均值和标準差:
-
正态分布(最最最最最重要!)
正态分布是統計學中常見的一種分布,表現為兩邊對稱,是一種鐘型的機率分布(bell curve),其機率密度圖為:
其中,
是正态随機變量的均值;
是标準差;
是圓周率,約等于3.1416··· ;e=2.71828⋅⋅⋅
=0。瘦成閃電
特别的,當
且
的正态分布,被稱為标準正态分布(standard distribution),上圖最後一個公式就是标轉化
正态分布來近似二項分布 :
當n足夠大的時候,正态分布對于離散型二項分布能夠很好地近似。
評價正态分布 :
如何來确定資料是否正态分布,主要有以下幾種方法:
1. 圖形感受法:建立直方圖或者枝幹圖,看圖像的形狀是否類似正态曲線,既土墩形或者鐘形,并且兩端對稱。
2. 計算區間
,看落在區間的百分比是否近似于68%,95%,100%。(切比雪夫法則和經驗法則)
3. 求IQR和标準差s,計算IQR/s,如若是正态分布,則IQR/s≈1.3.
4. 建立正态機率圖,如果近似正态分布,點會落在一條直線上。
-
指數分布E(λ)
指數分布是描述泊松分布P(𝜆)中事件發生時間間隔的機率分布。除了用于蔔瓦松過程的分析,還有許多其他應用,如以下場景:
- 世界杯比賽中進球之間的時間間隔
- 超市客戶中心接到顧客來電之間的時間間隔
- 流星雨發生的時間間隔
- 機器發生故障之間的時間間隔
- 癌症病人從确診到死亡的時間間隔
個别教科書中,參數為θ=1/λ,在機率密度函數和分布函數中做同樣的替換即可
指數分布有如下的适用條件:
1. x是兩個事件發生之間的時間間隔,并且x>0;
2. 事件之間是互相獨立的;
3. 事件發生的頻率是穩定的;
4. 兩個事件不能發生在同一瞬間。
這幾個條件實質上也是使用泊松分布的前提條件。如果滿足上述條件,則x是一個指數随機變量,x的分布是一個指數分布。如果不滿足上述條件,那麼需要使用Weibull分布或者gamma分布。
指數分布隻有一個參數,“λ”,λ是事件發生的頻率,在不同的應用場景中可能有不同名稱:
- 事件頻率
- 到達頻率
- 死亡率
- 故障率
- 轉變率
- …………
λ是單元時間内事件發生的次數,這裡需要注意的是,單元時間可以是秒,分,小時等不同的機關,同時λ根據單元時間度量的不同,其數值也不一樣。如單元時間為1小時,λ為6,則單元時間1分鐘,λ為6/60=0.1
指數分布的機率密度函數(probability density func,PDF)由λ和x(時間)構成:
均值:
方差:
舉例
一個裝置出現多次故障的時間間隔記錄如下:
23, 261, 87, 7, 120, 14, 62, 47, 225, 71, 246, 21, 42, 20, 5, 12, 120, 11, 3, 14, 71, 11, 14, 11, 16, 90, 1, 16, 52, 95
根據上面資料,我們可以計算得到該裝置發生故障的平均時間是59.6小時,即機關小時時間内發生故障事件的次數為λ=1/59.6=0.0168。
那麼該裝置在3天(72小時)内出現故障的機率是多大呢?即求P(x<72),這就需要計算指數分布的累積分布函數:
也即該裝置3天内出現故障的機率大于70%。
2.4 一維随機變量函數的分布
2.4.1離散型随機變量的函數分布
2.4.2連續型随機變量函數的機率密度
3.二維随機變量
3.1 二維随機變量及其分布
3.1.1 邊緣分布函數
- 判斷X、Y的獨立性
3.1.2 二維離散型随機變量
無限可列多對:泊松分布,x y 取整數到無窮
3.1.3 二維連續型随機變量
-
二維均勻分布
-
二維正态分布
該二維函數分布了,之後再補充