這篇文章總結了機率統計中期望、方差、協方差和相關系數的定義、性質和基本運算規則。
設p(x)是一個離散機率分布函數自變量的取值範圍是。那麼其期望被定義為:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 設p(x)是一個連續機率分布函數 ,那麼他的期望是:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 1.線性運算:
期望服從先行性質,是以線性運算的期望等于期望的線性運算:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 我們可以把它推廣到任意一般情況:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 2.函數的期望:
設f(x)是x的函數,則f(x)的期望為:
離散:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 連續:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 3.乘積的期望:
一般來說,乘積的期望不等于期望的乘積,除非變量互相獨立。是以,如果x和y互相獨立,則
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 期望的運算構成了統計量的運算基礎,因為方差、協方差等統計量本質上是一種特殊的期望。
1.e(c)=c
2.e(cx)=ce(x)
3.e(x+y)=e(x)+e(y)
4.當x和y互相獨立時,e(xy)=e(x)e(y)
性質3和性質4可以推到到任意有限個互相獨立的随機變量之和或之積的情況。
某城市有10萬個家庭,沒有孩子的家庭有1000個,有一個孩子的家庭有9萬個,有兩個孩子的家庭有6000個,有3個孩子的家庭有3000個。求一個家庭平均小孩的數目:
思路:則此城市中任一個家庭中孩子的數目是一個随機變量。它可取值0,1,2,3。其中取0的機率為0.01(1000/10萬),取1的機率0.9(9000/10萬),取2的機率為0.06(6000/10萬),取3的機率為0.03(3000/10萬)。它的數學期望0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一個家庭平均有小孩1.11個。用數學式子表示為e(x)=1.11。
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 方差是一種特殊的期望,
被定義為:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 離散型的方差:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 連續型的方差:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 以上兩式是一樣的,隻是寫法不同。
證明:由數學期望的性質得
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 2.設x是随機變量,c是常數,則有
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 3.設 x 與 y 是兩個随機變量,則
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 其中協方差
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 特别的,當x,y是兩個不相關的随機變量(互相獨立)則
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 此性質可以推廣到有限多個兩兩不相關的随機變量之和的情況。
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 标準差與方差不同的是,标準差和變量的計算機關相同,比方差清楚,是以很多時候我們分析的時候更多的使用的是标準差。
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 特殊情況下,當x=y時:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 從直覺上來看,協方差表示的是兩個變量總體誤差的期望。
如果兩個變量的變化趨勢一緻,也就是說如果其中一個大于自身的期望值時另外一個也大于自身的期望值,那麼兩個變量之間的協方差就是正值;如果兩個變量的變化趨勢相反,即其中一個變量大于自身的期望值時另外一個卻小于自身的期望值,那麼兩個變量之間的協方差就是負值。
如果x與y是統計獨立的,那麼二者之間的協方差就是0,因為兩個獨立的随機變量滿足e[xy]=e[x]e[y]。
但是,反過來并不成立。即如果x與y的協方差為0,二者并不一定是統計獨立的。
(1)cov(x,y)=cov(y,x);
(2)cov(ax,by)=abcov(x,y),(a,b是常數);
(3)cov(x1+x2,y)=cov(x1,y)+cov(x2,y)。
由協方差定義,可以看出cov(x,x)=d(x),cov(y,y)=d(y)。
定義:
期望、方差、協方差及相關系數的基本運算一、期望
二、方差
三、協方差
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
五、參考資料 稱為随機變量x和y的(pearson)相關系數。
1.若ρxy=0,則稱x與y不線性相關。
2.即ρxy=0的充分必要條件是cov(x,y)=0,亦即不相關和協方差為零是等價的。
3.相關系數ρxy取值在-1到1之間,ρxy = 0時,稱x,y不相關;
| ρxy | < 1時,x的變動引起y的部分變動,ρxy的絕對值越大,x的變動引起y的變動就越大;
| ρxy | > 0.8時稱為高度相關,當 | ρxy | < 0.3時稱為低度相關,其它時候為中度相關。