原文連結:http://tecdat.cn/?p=13839
原文出處:拓端資料部落公衆号
上周在課程中,我們了解了廣義線性模型的理論,強調了兩個重要組成部分
- 連結函數(這實際上是在預測模型的關鍵)
- 分布或方差函數
考慮資料集
lin.mod = lm(dist~speed,data=cars)
線性模型
假設殘差獨立且具有相同的方差。如果我們可視化線性回歸,會看到:
這裡的想法(在GLM中)是假設
它将基于某些誤差項生成與先前描述的模型相同的模型。該模型可以在下面看到,
C=trans3d(c(x,x),c(y,rev(y)),c(z,z0),mat)
polygon(C,light blue",density=40)
C=trans3d(x,y,z0,mat)
lines(C,lty=2)
C=trans3d(x,y,z,mat)
lines(C,col="blue")}
這裡确實有兩部分:平均值的線性增加
和正态分布的恒定方差
。
另一方面,如果我們假設泊松回歸,
poisson.reg = glm(dist~speed,data=cars,family=poisson(link="log"))
我們有這樣的結果
有兩件事同時發生了變化:我們的模型不再是線性的,而是指數的
,并且方差也随着解釋變量的增加而增加
,因為有了泊松回歸,
如果改編前面的代碼,我們得到
問題是,當我們從線性模型引入Poisson回歸時,我們改變了兩件事。是以,讓我們看看當我們分别更改兩個元件時會發生什麼。首先,我們可以使用高斯模型來更改連結函數,但是這次是乘法模型(具有對數連結函數)
這次是非線性的。或者我們可以在Poisson回歸中更改連結函數,以獲得線性模型,但異方差
是以,這基本上就是GLM的目的。