天天看點

随機變量及其分布之一維随機變量

1.一維随機變量

​ 首先需要介紹,分布函數和密度函數的概念,離散型和連續型都有分布函數,定義為:

P ( X ≤ k ) = F ( x ) P(X\le k) = F(x) P(X≤k)=F(x)

稱 F ( x ) F(x) F(x)為分布函數,簡寫為 d f df df。

對于連續型随機變量而言,F(x)還可以寫成如下形式:

F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}f(x)dx F(x)=∫−∞x​f(x)dx

其中 f ( x ) f(x) f(x)稱為連續型随機變量的機率密度函數,簡寫為 p f pf pf.

而對于離散性随機變量, F ( x ) F(x) F(x)也可寫成;

F ( x ) = Σ x = 1 k P ( X = k ) F(x)=\Sigma_{x=1}^{k}P(X=k) F(x)=Σx=1k​P(X=k)

其中 P ( X = k ) P(X=k) P(X=k)稱為離散型随機變量的密度函數。

分布函數的性質

單調非降  
在某一點的機率為0
           

1.1離散型随機變量

1.1.1常見的離散分布

(1)均勻分布

(2)二項分布

(3)0-1分布

(4)泊松分布(poisson)

P ( X = k ) = e − λ ∗ λ k k ! P(X=k)=e^{-\lambda}*\frac{\lambda^k}{k!} P(X=k)=e−λ∗k!λk​

泊松分布中,參數 λ \lambda λ的含義是機關時間内事件發生的次數,記為 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ),泊松分布的用途——可以用來進行稀有事件的計算,同時也可以在 n n n比較大, p p p比較小時作為二項分布的一種近似。此時,參數 λ = n ∗ p \lambda=n*p λ=n∗p

(5)幾何分布

幾何分布定義為,在 n n n次獨立伯努利實驗中,事件第 k k k次發生的機率

P ( X = k ) = p × ( 1 − p ) k − 1 P(X=k)=p \times (1-p)^{k-1} P(X=k)=p×(1−p)k−1

注意,幾何分布不具有記憶性,即:

P ( X = t + s ∣ X = t ) = P ( X = t ) P(X=t+s|X=t)=P(X=t) P(X=t+s∣X=t)=P(X=t)

(6)超幾何分布(不放回抽樣)

1.2連續型随機變量

(1)均勻分布——uniform df

其密度函數為

f ( x ) = { 1 b − a a < x < b 0 x ≤ a o r x ≥ b f(x)=\left \{ \begin{aligned} &\frac{1}{b-a}\quad a<x<b &\\ & 0 \quad x\leq a \quad or \quad x\geq b &\\ \end{aligned} \right. f(x)=⎩⎨⎧​​b−a1​a<x<b0x≤aorx≥b​​

若定義示性函數為

I ( a , b ) x = { 1 a < x < b 0 x ≤ a o r x ≥ b I_{(a,b)}^{x} = \left \{ \begin{aligned} & 1 \quad a<x<b &\\ & 0 \quad x\leq a \quad or \quad x\geq b &\\ \end{aligned} \right. I(a,b)x​={​1a<x<b0x≤aorx≥b​​

則均勻分布的密度函數可寫為

f ( x ) = 1 b − a × I ( a , b ) x f(x)=\frac{1}{b-a}\times I_{(a,b)}^x f(x)=b−a1​×I(a,b)x​

(2)指數分布

密度函數為

f ( x ) = λ × e − λ x × I ( 0 , ∞ ) x f(x)=\lambda\times e^{-\lambda x}\times I_{(0,\infty)}^{x} f(x)=λ×e−λx×I(0,∞)x​

分布函數為

F ( x ) = ( 1 − e − λ x ) × I ( 0 , ∞ ) x F(x)=(1-e^{-\lambda x})\times I_{(0,\infty)}^{x} F(x)=(1−e−λx)×I(0,∞)x​

注意:指數分布也無記憶性

(3)正态分布 normal

其密度函數為

f ( x ) = 1 2 π × σ × e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi}\times\sigma}\times e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2π

​×σ1​×e−2σ2(x−μ)2​

記為 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)

特别的,當 μ = 0 , σ = 1 \mu = 0,\sigma = 1 μ=0,σ=1時,稱為标準正态分布

三倍标準差原則

正态分布可以變為标準正态分布,隻需要做一個簡單替換:

y = x − μ σ y=\frac{x-\mu}{\sigma} y=σx−μ​

那麼,變換後的 y y y是服從于标準正态的

1.3随機變量函數的分布——牢記定義

當 X X X是随機變量時,那麼 Y = g ( X ) Y=g(X) Y=g(X)的分布稱為随機變量函數的分布 ,那麼由定義,要求 Y Y Y分布,即

P ( Y ≤ y ) = F ( y ) P(Y\leq y)=F(y) P(Y≤y)=F(y)

那麼根據定義,我們求解的過程為:

F ( y ) = P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = ∫ g ( x ) ≤ y f ( x ) d x F(y) = P(Y\leq y) \\ = P(g(X)\leq y)\\ = \int_{g(x)\leq y} f(x)dx F(y)=P(Y≤y)=P(g(X)≤y)=∫g(x)≤y​f(x)dx

以上是連續型随機變量函數分布求法

定理

假設 X X X是連續型随機變量,假設 Y = g ( X ) Y=g(X) Y=g(X)定義為單調函數(必須是嚴格單調),那麼 Y Y Y的密度函數為

f y ( x ) = f ( h ( y ) ) × ∣ h ′ ( y ) ∣ 其 中 f y ( y ) 代 表 Y 的 密 度 函 數 , h ( y ) 是 g ( x ) 的 反 函 數 f_y(x) = f(h(y))\times|h^{'}(y)| \quad 其中f_y(y)代表Y的密度函數,h(y)是g(x)的反函數 fy​(x)=f(h(y))×∣h′(y)∣其中fy​(y)代表Y的密度函數,h(y)是g(x)的反函數

1.4 補充知識點

1.4.1

标準正态分布的性質

ϕ ( x ) + ϕ ( − x ) = 1 其 中 ϕ 為 标 準 正 态 分 布 的 分 布 函 數 \phi(x)+\phi(-x)=1 \quad 其中\phi為标準正态分布的分布函數 ϕ(x)+ϕ(−x)=1其中ϕ為标準正态分布的分布函數

1.4.2

若 X ∼ N ( μ , σ 2 ) , Y = a x + b , 那 麼 Y ∼ N ( a μ + b , μ 2 σ 2 ) 若X\sim N(\mu,\sigma^2),Y=ax+b,那麼Y \sim N(a\mu+b,\mu^2\sigma^2) 若X∼N(μ,σ2),Y=ax+b,那麼Y∼N(aμ+b,μ2σ2)

繼續閱讀