1.一維随機變量
首先需要介紹,分布函數和密度函數的概念,離散型和連續型都有分布函數,定義為:
P ( X ≤ k ) = F ( x ) P(X\le k) = F(x) P(X≤k)=F(x)
稱 F ( x ) F(x) F(x)為分布函數,簡寫為 d f df df。
對于連續型随機變量而言,F(x)還可以寫成如下形式:
F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}f(x)dx F(x)=∫−∞xf(x)dx
其中 f ( x ) f(x) f(x)稱為連續型随機變量的機率密度函數,簡寫為 p f pf pf.
而對于離散性随機變量, F ( x ) F(x) F(x)也可寫成;
F ( x ) = Σ x = 1 k P ( X = k ) F(x)=\Sigma_{x=1}^{k}P(X=k) F(x)=Σx=1kP(X=k)
其中 P ( X = k ) P(X=k) P(X=k)稱為離散型随機變量的密度函數。
分布函數的性質
單調非降
在某一點的機率為0
1.1離散型随機變量
1.1.1常見的離散分布
(1)均勻分布
(2)二項分布
(3)0-1分布
(4)泊松分布(poisson)
P ( X = k ) = e − λ ∗ λ k k ! P(X=k)=e^{-\lambda}*\frac{\lambda^k}{k!} P(X=k)=e−λ∗k!λk
泊松分布中,參數 λ \lambda λ的含義是機關時間内事件發生的次數,記為 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ),泊松分布的用途——可以用來進行稀有事件的計算,同時也可以在 n n n比較大, p p p比較小時作為二項分布的一種近似。此時,參數 λ = n ∗ p \lambda=n*p λ=n∗p
(5)幾何分布
幾何分布定義為,在 n n n次獨立伯努利實驗中,事件第 k k k次發生的機率
P ( X = k ) = p × ( 1 − p ) k − 1 P(X=k)=p \times (1-p)^{k-1} P(X=k)=p×(1−p)k−1
注意,幾何分布不具有記憶性,即:
P ( X = t + s ∣ X = t ) = P ( X = t ) P(X=t+s|X=t)=P(X=t) P(X=t+s∣X=t)=P(X=t)
(6)超幾何分布(不放回抽樣)
1.2連續型随機變量
(1)均勻分布——uniform df
其密度函數為
f ( x ) = { 1 b − a a < x < b 0 x ≤ a o r x ≥ b f(x)=\left \{ \begin{aligned} &\frac{1}{b-a}\quad a<x<b &\\ & 0 \quad x\leq a \quad or \quad x\geq b &\\ \end{aligned} \right. f(x)=⎩⎨⎧b−a1a<x<b0x≤aorx≥b
若定義示性函數為
I ( a , b ) x = { 1 a < x < b 0 x ≤ a o r x ≥ b I_{(a,b)}^{x} = \left \{ \begin{aligned} & 1 \quad a<x<b &\\ & 0 \quad x\leq a \quad or \quad x\geq b &\\ \end{aligned} \right. I(a,b)x={1a<x<b0x≤aorx≥b
則均勻分布的密度函數可寫為
f ( x ) = 1 b − a × I ( a , b ) x f(x)=\frac{1}{b-a}\times I_{(a,b)}^x f(x)=b−a1×I(a,b)x
(2)指數分布
密度函數為
f ( x ) = λ × e − λ x × I ( 0 , ∞ ) x f(x)=\lambda\times e^{-\lambda x}\times I_{(0,\infty)}^{x} f(x)=λ×e−λx×I(0,∞)x
分布函數為
F ( x ) = ( 1 − e − λ x ) × I ( 0 , ∞ ) x F(x)=(1-e^{-\lambda x})\times I_{(0,\infty)}^{x} F(x)=(1−e−λx)×I(0,∞)x
注意:指數分布也無記憶性
(3)正态分布 normal
其密度函數為
f ( x ) = 1 2 π × σ × e − ( x − μ ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi}\times\sigma}\times e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2π
×σ1×e−2σ2(x−μ)2
記為 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)
特别的,當 μ = 0 , σ = 1 \mu = 0,\sigma = 1 μ=0,σ=1時,稱為标準正态分布
三倍标準差原則
正态分布可以變為标準正态分布,隻需要做一個簡單替換:
y = x − μ σ y=\frac{x-\mu}{\sigma} y=σx−μ
那麼,變換後的 y y y是服從于标準正态的
1.3随機變量函數的分布——牢記定義
當 X X X是随機變量時,那麼 Y = g ( X ) Y=g(X) Y=g(X)的分布稱為随機變量函數的分布 ,那麼由定義,要求 Y Y Y分布,即
P ( Y ≤ y ) = F ( y ) P(Y\leq y)=F(y) P(Y≤y)=F(y)
那麼根據定義,我們求解的過程為:
F ( y ) = P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = ∫ g ( x ) ≤ y f ( x ) d x F(y) = P(Y\leq y) \\ = P(g(X)\leq y)\\ = \int_{g(x)\leq y} f(x)dx F(y)=P(Y≤y)=P(g(X)≤y)=∫g(x)≤yf(x)dx
以上是連續型随機變量函數分布求法
定理
假設 X X X是連續型随機變量,假設 Y = g ( X ) Y=g(X) Y=g(X)定義為單調函數(必須是嚴格單調),那麼 Y Y Y的密度函數為
f y ( x ) = f ( h ( y ) ) × ∣ h ′ ( y ) ∣ 其 中 f y ( y ) 代 表 Y 的 密 度 函 數 , h ( y ) 是 g ( x ) 的 反 函 數 f_y(x) = f(h(y))\times|h^{'}(y)| \quad 其中f_y(y)代表Y的密度函數,h(y)是g(x)的反函數 fy(x)=f(h(y))×∣h′(y)∣其中fy(y)代表Y的密度函數,h(y)是g(x)的反函數
1.4 補充知識點
1.4.1
标準正态分布的性質
ϕ ( x ) + ϕ ( − x ) = 1 其 中 ϕ 為 标 準 正 态 分 布 的 分 布 函 數 \phi(x)+\phi(-x)=1 \quad 其中\phi為标準正态分布的分布函數 ϕ(x)+ϕ(−x)=1其中ϕ為标準正态分布的分布函數
1.4.2
若 X ∼ N ( μ , σ 2 ) , Y = a x + b , 那 麼 Y ∼ N ( a μ + b , μ 2 σ 2 ) 若X\sim N(\mu,\sigma^2),Y=ax+b,那麼Y \sim N(a\mu+b,\mu^2\sigma^2) 若X∼N(μ,σ2),Y=ax+b,那麼Y∼N(aμ+b,μ2σ2)