随機變量及其分布之一維随機變量

1.一維随機變量

首先需要介紹，分布函數和密度函數的概念，離散型和連續型都有分布函數，定義為：

P ( X ≤ k ) = F ( x ) P(X\le k) = F(x) P(X≤k)=F(x)

稱 F ( x ) F(x) F(x)為分布函數，簡寫為 d f df df。

對于連續型随機變量而言，F(x)還可以寫成如下形式：

F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}f(x)dx F(x)=∫−∞xf(x)dx

其中 f ( x ) f(x) f(x)稱為連續型随機變量的機率密度函數，簡寫為 p f pf pf.

而對于離散性随機變量， F ( x ) F(x) F(x)也可寫成；

F ( x ) = Σ x = 1 k P ( X = k ) F(x)=\Sigma_{x=1}^{k}P(X=k) F(x)=Σx=1kP(X=k)

其中 P ( X = k ) P(X=k) P(X=k)稱為離散型随機變量的密度函數。

分布函數的性質

單調非降  
在某一點的機率為0

1.1離散型随機變量

1.1.1常見的離散分布

（1）均勻分布

（2）二項分布

（3）0-1分布

（4）泊松分布（poisson）

P ( X = k ) = e − λ ∗ λ k k ! P(X=k)=e^{-\lambda}*\frac{\lambda^k}{k!} P(X=k)=e−λ∗k!λk

泊松分布中，參數 λ \lambda λ的含義是機關時間内事件發生的次數，記為 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ),泊松分布的用途——可以用來進行稀有事件的計算，同時也可以在 n n n比較大， p p p比較小時作為二項分布的一種近似。此時，參數 λ = n ∗ p \lambda=n*p λ=n∗p

（5）幾何分布

幾何分布定義為，在 n n n次獨立伯努利實驗中，事件第 k k k次發生的機率

P ( X = k ) = p × ( 1 − p ) k − 1 P(X=k)=p \times (1-p)^{k-1} P(X=k)=p×(1−p)k−1

注意，幾何分布不具有記憶性，即：

P ( X = t + s ∣ X = t ) = P ( X = t ) P(X=t+s|X=t)=P(X=t) P(X=t+s∣X=t)=P(X=t)

（6）超幾何分布（不放回抽樣）

1.2連續型随機變量

（1）均勻分布——uniform df

其密度函數為

f ( x ) = { 1 b − a a < x < b 0 x ≤ a o r x ≥ b f(x)=\left \{ \begin{aligned} &\frac{1}{b-a}\quad a<x<b &\\ & 0 \quad x\leq a \quad or \quad x\geq b &\\ \end{aligned} \right. f(x)=⎩⎨⎧b−a1a<x<b0x≤aorx≥b

若定義示性函數為

I ( a , b ) x = { 1 a < x < b 0 x ≤ a o r x ≥ b I_{(a,b)}^{x} = \left \{ \begin{aligned} & 1 \quad a<x<b &\\ & 0 \quad x\leq a \quad or \quad x\geq b &\\ \end{aligned} \right. I(a,b)x={1a<x<b0x≤aorx≥b

則均勻分布的密度函數可寫為

f ( x ) = 1 b − a × I ( a , b ) x f(x)=\frac{1}{b-a}\times I_{(a,b)}^x f(x)=b−a1×I(a,b)x

(2)指數分布

密度函數為

f ( x ) = λ × e − λ x × I ( 0 , ∞ ) x f(x)=\lambda\times e^{-\lambda x}\times I_{(0,\infty)}^{x} f(x)=λ×e−λx×I(0,∞)x

分布函數為

F ( x ) = ( 1 − e − λ x ) × I ( 0 , ∞ ) x F(x)=(1-e^{-\lambda x})\times I_{(0,\infty)}^{x} F(x)=(1−e−λx)×I(0,∞)x

注意：指數分布也無記憶性

（3）正态分布 normal

其密度函數為

f ( x ) = 1 2 π × σ × e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi}\times\sigma}\times e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2π

×σ1×e−2σ2(x−μ)2

記為 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)

特别的，當 μ = 0 , σ = 1 \mu = 0,\sigma = 1 μ=0,σ=1時，稱為标準正态分布

三倍标準差原則

正态分布可以變為标準正态分布，隻需要做一個簡單替換：

y = x − μ σ y=\frac{x-\mu}{\sigma} y=σx−μ

那麼，變換後的 y y y是服從于标準正态的

1.3随機變量函數的分布——牢記定義

當 X X X是随機變量時，那麼 Y = g ( X ) Y=g(X) Y=g(X)的分布稱為随機變量函數的分布，那麼由定義，要求 Y Y Y分布，即

P ( Y ≤ y ) = F ( y ) P(Y\leq y)=F(y) P(Y≤y)=F(y)

那麼根據定義，我們求解的過程為：

F ( y ) = P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = ∫ g ( x ) ≤ y f ( x ) d x F(y) = P(Y\leq y) \\ = P(g(X)\leq y)\\ = \int_{g(x)\leq y} f(x)dx F(y)=P(Y≤y)=P(g(X)≤y)=∫g(x)≤yf(x)dx

以上是連續型随機變量函數分布求法

定理

假設 X X X是連續型随機變量，假設 Y = g ( X ) Y=g(X) Y=g(X)定義為單調函數（必須是嚴格單調），那麼 Y Y Y的密度函數為

f y ( x ) = f ( h ( y ) ) × ∣ h ′ ( y ) ∣ 其中 f y ( y ) 代表 Y 的密度函數， h ( y ) 是 g ( x ) 的反函數 f_y(x) = f(h(y))\times|h^{'}(y)| \quad 其中f_y(y)代表Y的密度函數，h(y)是g(x)的反函數 fy(x)=f(h(y))×∣h′(y)∣其中fy(y)代表Y的密度函數，h(y)是g(x)的反函數

1.4 補充知識點

1.4.1

标準正态分布的性質

ϕ ( x ) + ϕ ( − x ) = 1 其中 ϕ 為标準正态分布的分布函數 \phi(x)+\phi(-x)=1 \quad 其中\phi為标準正态分布的分布函數 ϕ(x)+ϕ(−x)=1其中ϕ為标準正态分布的分布函數

1.4.2

若 X ∼ N ( μ , σ 2 ) , Y = a x + b , 那麼 Y ∼ N ( a μ + b , μ 2 σ 2 ) 若X\sim N(\mu,\sigma^2),Y=ax+b,那麼Y \sim N(a\mu+b,\mu^2\sigma^2) 若X∼N(μ,σ2),Y=ax+b,那麼Y∼N(aμ+b,μ2σ2)

随機變量及其分布之一維随機變量

1.一維随機變量

1.1離散型随機變量

1.1.1常見的離散分布

1.2連續型随機變量

1.3随機變量函數的分布——牢記定義

1.4 補充知識點

1.4.1

1.4.2

繼續閱讀

信号的峰度和偏度信号的高階矩

Google Earth Engine（GEE）——python s2cloudless 進行 Sentinel-2 雲掩膜

信噪比與EbN0

聊聊生日悖論和生日攻擊

數理統計與描述性分析

二項分布與負二項分布卡片二項分布負二項分布示例

【優化充電】遺傳算法求解電動汽車充電管理優化問題【Matlab 1178期】

Human-level concept learning through probabilistic program induction

交叉熵損失函數二進制交叉熵損失函數多元交叉熵函數詳解

交叉熵損失函數原理和推導

模糊綜合評價模型一.概述二.經典集合和模糊集合的基本概念三.隸屬函數的三種确定方法四.應用：模糊綜合評價

泛統計理論初探——模型評估的驗證政策資料挖掘-模型驗證政策簡介

NILMTK——因子隐馬爾可夫之隐馬爾可夫1. 馬爾可夫鍊2.馬爾可夫模型3. 隐馬爾可夫模型4.HMM三種方式的實作5. hmmlearn應用

GMS：基于網格運動統計的快速極度魯棒的特征比對摘要1 簡介2 本文的方法3 應用于快速記分的網格架構4 實驗 5 結論

4 機率機器人 Probabilistic Robotics 擴充卡爾曼濾波算法1 前提介紹2 通過泰勒展式進行線性化3 擴充卡爾曼濾波算法（EKF）4 擴充卡爾曼濾波執行個體5 擴充卡爾曼濾波（EKF）公式推導6 擴充卡爾曼濾波的優缺點7 參考文獻

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法