天天看點

多項logistic回歸系數解釋_Logistic回歸結果的回歸系數和OR值解讀

Logistic回歸結果的回歸系數和OR值解讀。Logistic回歸雖然名字叫”回歸” ,但卻是一種分類學習方法。使用場景大概有兩個:第一用來預測,第二尋找因變量的影響因素。

一 從線性回歸到Logistic回歸

線性回歸和Logistic回歸都是廣義線性模型的特例。

假設有一個因變量y和一組自變量x1, x2, x3, ... , xn,其中y為連續變量,我們可以拟合一個線性方程:

y =β0+β1*x1+β2*x2+β3*x3+...+βn*xn

并通過最小二乘法估計各個β系數的值。

如果y為二分類變量,隻能取值0或1,那麼線性回歸方程就會遇到困難: 方程右側是一個連續的值,取值為負無窮到正無窮,而左側隻能取值[0,1],無法對應。為了繼續使用線性回歸的思想,統計學家想到了一個變換方法,就是将方程右邊的取值變換為[0,1]。最後選中了Logistic函數:

y = 1 / (1+e-x)

這是一個S型函數,值域為(0,1),能将任何數值映射到(0,1),且具有無限階可導等優良數學性質。

我們将線性回歸方程改寫為:

y = 1 / (1+e-z),

其中,z =β0+β1*x1+β2*x2+β3*x3+...+βn*xn

此時方程兩邊的取值都在0和1之間。

進一步數學變換,可以寫為:

Ln(y/(1-y)) =β0+β1*x1+β2*x2+β3*x3+...+βn*xn

Ln(y/(1-y))稱為Lo