一、期望
定義:
設P(x)是一個離散機率分布函數自變量的取值範圍是
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 。那麼其期望被定義為:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 設P(x)是一個連續機率分布函數 ,那麼他的期望是:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 性質:
1.線性運算:
期望服從先行性質,是以線性運算的期望等于期望的線性運算:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
我們可以把它推廣到任意一般情況:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 2.函數的期望:
設f(x)是x的函數,則f(x)的期望為:
離散:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 連續:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 3.乘積的期望:
一般來說,乘積的期望不等于期望的乘積,除非變量互相獨立。是以,如果x和y互相獨立,則
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 期望的運算構成了統計量的運算基礎,因為方差、協方差等統計量本質上是一種特殊的期望。
設C為一個常數,X和Y是兩個 随機變量。以下是數學期望的重要性質: 1.E(C)=C 2.E(CX)=CE(X) 3.E(X+Y)=E(X)+E(Y) 4.當X和Y互相獨立時,E(XY)=E(X)E(Y) 性質3和性質4可以推到到任意有限個互相獨立的随機變量之和或之積的情況。
例子:
某城市有10萬個家庭,沒有孩子的家庭有1000個,有一個孩子的家庭有9萬個,有兩個孩子的家庭有6000個,有3個孩子的家庭有3000個。求一個家庭平均小孩的數目: 思路:則此城市中任一個家庭中孩子的數目是一個随機變量。它可取值0,1,2,3。 其中取0的機率為0.01(1000/10萬),取1的機率0.9(9000/10萬),取2的機率為0.06(6000/10萬),取3的機率為0.03(3000/10萬) 。 它的數學期望0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一個家庭平均有小孩1.11個。 用數學式子表示為E(X)=1.11。
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 二、方差
定義:
方差是一種特殊的期望, 被定義為:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 離散型的方差:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 連續型的方差:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 以上兩式是一樣的,隻是寫法不同。 證明:由數學期望的性質得
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 性質:
1.設C是 常數,則D(C)=0 2.設X是随機變量,C是常數,則有
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 3.設 X 與 Y 是兩個随機變量,則
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 其中協方差
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 特别的,當X,Y是兩個不相關的随機變量(互相獨立)則
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 此性質可以推廣到有限多個兩兩不相關的随機變量之和的情況。
統計學意義:
方差和标準差是測算離散趨勢最重要、最常用的名額。方差是各變量值與其均值離差平方的平均數,它是測算數值型資料離散程度的最重要的方法。标準差為方差的算術平方根,用S表示。方差相應的計算公式為 (無偏性)。
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 标準差與方差不同的是,标準差和變量的計算機關相同,比方差清楚,是以很多時候我們分析的時候更多的使用的是标準差。
三、協方差
定義:
在機率論和統計學中,協方差用于衡量兩個變量的總體誤差。期望值分别為E[X]與E[Y]的兩個實随機變量X與Y之間的協方差Cov(X,Y)定義為:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 特殊情況下,當X=Y時:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 從直覺上來看,協方差表示的是兩個變量總體誤差的期望。 如果兩個變量的變化趨勢一緻,也就是說如果其中一個大于自身的期望值時另外一個也大于自身的期望值,那麼兩個變量之間的協方差就是正值;如果兩個變量的變化趨勢相反,即其中一個變量大于自身的期望值時另外一個卻小于自身的期望值,那麼兩個變量之間的協方差就是負值。 如果 X與 Y是統計獨立的,那麼二者之間的協方差就是0,因為兩個獨立的随機變量滿足 E[ XY]= E[ X] E[ Y]。 但是,反過來并不成立。即如果 X與 Y的協方差為0,二者并不一定是統計獨立的。
性質:
(1)Cov(X,Y)=Cov(Y,X); (2)Cov( aX, bY)= abCov(X,Y),( a, b是常數); (3)Cov(X 1+X 2,Y)=Cov(X 1,Y)+Cov(X 2,Y)。 由協方差定義,可以看出Cov(X,X)=D(X),Cov(Y,Y)=D(Y)。
四、相關系數
協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;
定義:
期望、方差、協方差及相關系數的原理了解和計算一、期望二、方差三、協方差四、相關系數 協方差作為描述X和Y相關程度的量,在同一實體量綱之下有一定的作用,但同樣的兩個量采用不同的量綱使它們的協方差在數值上表現出很大的差異。為此引入如下概念;五、參考資料 稱為随機變量X和Y的(Pearson)相關系數。
性質:
1.若 ρXY=0,則稱X與Y不線性相關。 2.即 ρXY=0的充分必要條件是Cov(X,Y)=0,亦即不相關和協方差為零是等價的。 3. 相關系數ρ XY 取值在-1到1之間,ρ XY = 0時,稱X,Y不相關; | ρ XY | = 1時,稱X,Y 完全相關 ,此時,X,Y之間具有線性函數關系; | ρ XY | < 1時,X的變動引起Y的部分變動,ρ XY 的絕對值越大,X的變動引起Y的變動就越大; | ρ XY | > 0.8時稱為高度相關,當 | ρ XY | < 0.3時稱為低度相關,其它時候為中度相關。
五、參考資料
1.協方差、相關系數等百度百科
2.北航之張洋系列