天天看點

多重共線性的診斷與對策

多重共線性的确認:

做出自變量間的相關系數矩陣:如果相關系數超過0.9的變量在分析時将會存在共線性問題。在0.8以上可能會有問題。但這種方法隻能對共線性作初步的判斷,并不全面。

【1】容忍度(Tolerance):有 Norusis 提出,即以每個自變量作為應變量對其他自變量進行回歸分析時得到的殘差比例,大小用1減決定系數來表示。該名額越小,則說明該自變量被其餘變量預測的越精确,共線性可能就越嚴重。陳希孺等根據經驗得出:如果某個自變量的容忍度小于0.1,則可能存在共線性問題。

【2】方差膨脹因子(Variance inflation factor, VIF): 由Marquardt于1960年提出,實際上就是容忍度的倒數。VIF都是大于1的數,一般認為小于5時幾近沒有多重共線性,在[5, 10)間時存在一定的多重共線性,大于10則有需要關注的多重共線性,這時應當對變量進行調整,大于100時有嚴重冊多重共線性,此時後續回歸的系數具有高度可變性,故系數不可信。

【3】特征根(Eigenvalue):該方法實際上就是對自變量進行主成分分析,如果相當多元度的特征根等于0,則可能有比較嚴重的共線性。

【4】條件指數(Condition Idex):由Stewart等提出,當某些次元的該名額數值大于30時,則能存在共線性。

多重共線性的對策:

【1】增大樣本量,可部分的解決共線性問題

【2】采用多種自變量篩選方法相結合的方式,建立一個最優的逐漸回歸方程。

【3】從專業的角度加以判斷,人為的去除在專業上比較次要的,或者缺失值比較多,測量誤差比較大的共線性因子。

【4】進行主成分分析,用提取的因子代替原變量進行回歸分析。

【5】進行嶺回歸分析,它可以有效的解決多重共線性問題。

【6】進行通徑分析(Path Analysis),它可以對應自變量間的關系加以精細的刻畫。

繼續閱讀