天天看點

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

原文連結:http://tecdat.cn/?p=13839

原文出處:拓端資料部落公衆号

上周在課程中,我們了解了廣義線性模型的理論,強調了兩個重要組成部分

  • 連結函數(這實際上是在預測模型的關鍵)
  • 分布或方差函數

考慮資料集

­lin.mod = lm(dist~speed,data=cars)
           

線性模型 

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

假設殘差獨立且具有相同的方差。如果我們可視化線性回歸,會看到:

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

這裡的想法(在GLM中)是假設

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

它将基于某些誤差項生成與先前描述的模型相同的模型。該模型可以在下面看到,

C=trans3d(c(x,x),c(y,rev(y)),c(z,z0),mat)
polygon(C,light blue",density=40)
C=trans3d(x,y,z0,mat)
lines(C,lty=2)
C=trans3d(x,y,z,mat)
lines(C,col="blue")}
           
拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

這裡确實有兩部分:平均值的線性增加  

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

 和正态分布的恒定方差  

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

另一方面,如果我們假設泊松回歸,

poisson.reg = glm(dist~speed,data=cars,family=poisson(link="log"))
           

我們有這樣的結果

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

有兩件事同時發生了變化:我們的模型不再是線性的,而是指數的

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

,并且方差也随着解釋變量的增加而增加

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

,因為有了泊松回歸,

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

如果改編前面的代碼,我們得到

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

問題是,當我們從線性模型引入Poisson回歸時,我們改變了兩件事。是以,讓我們看看當我們分别更改兩個元件時會發生什麼。首先,我們可以使用高斯模型來更改連結函數,但是這次是乘法模型(具有對數連結函數)

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

這次是非線性的。或者我們可以在Poisson回歸中更改連結函數,以獲得線性模型,但異方差

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

是以,這基本上就是GLM的目的。

拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析

繼續閱讀