
Cov(X,X)=Var(X)
協方差是對X與Y之間關聯關系的一種測度,即測量X與Y的同步性。當X與Y同時出現較大值或者較小值時,COV>0,二者正相關。若X出現較大值時Y出現較小值,COV<0,二者負相關。該相關關系并不意味着因果關系
計算方式:E為期望算子,
為總體平均值。
從該式中我們可以發現,COV的大小與X、Y的大小有關。為了無量綱化,要對其進行标準化。就有了相關系數的概念。
相關系數定義為:就是協方差除了XY各自的标準差,這樣才能刻畫XY之間關聯性的強弱。
這裡需要注意,相關系數應該叫
線性相關系數,它隻能反映出線性關系。
為何隻能是線性關系的測度?
證明:
給出一個線性函數,Y=a+bX (b
,X的方差存在)
則,
是以,當X與Y完全線性的時候,總有相關系數為1或者為-1.
擴充到一般線性模型:Y=a+bX+
其中,
同理可證,
這裡,相關系數與1之間的偏離程度就受
的影響。
是以,其測度的隻是一種線性關系,并且絕對值不會超過1。