Logistic regression ,Softmax regression and Newton's method

2023-08-02 23:35:43

首先說的是Logistic regression,一般來說他隻能用于分兩類(0或1)的情況，雖然我曾在Andrew Ng的課上講過也可以處理多類的情況。

Logistic regression的思想非常簡單，就是将負無窮到正無窮的區間用一個函數映射到了0到1的區間。這個函數是：

使用這個函數是有一套理論支撐的，Andrew Ng在網易公開課有講，大概就是涉及到指數分布和一般線性模型的概念，比較複雜，這裡略過。

假如設Htheta(x)為x是1類的機率，那麼顯然有1-Htheta(x)為x是0類的機率,我們可以寫出兩個式子

P(y=1/x)=Htheta(x)

P(y=0/x)=1-Htheta(x)

那麼有：

Logistic regression ,Softmax regression and Newton's method

我之是以寫出這個式子，是因為我想用它來推導cost函數，而不是直接得到cost函數。

根據最大似然理論：

Logistic regression ,Softmax regression and Newton's method

根據這個式子，取對數後能夠得到cost函數為：

Logistic regression ,Softmax regression and Newton's method

接下來就是如何最小化這個cost函數得到最優的theta值，這裡可以用梯度下降法，或者牛頓法來解決。

這裡說下Logistic regression解決多類的問題，具體可以這樣做，當我們想要分很多類的時候，我們對于每一類當做一類，其他不屬于這個類的屬于另一類，然後可以算得一條分界線，對于k類的情況，可以算得k條分界線，也就是k個分類器，每當一個新的樣本來時，隻要枚舉所有分類器，每j個分類器能算出這個新的樣本屬于第j類的機率Pj(1<=j<=k),最後的結果則取使得Pj最大的那個j所對應的類。

Softmax regression 的Htheta函數和cost函數如下:

Logistic regression ,Softmax regression and Newton's method

可以發現，Softmax regression 和Logistic regression 的損失函數非常相似，

這是因為Logistic regression的損失函數可以寫成這樣：

Logistic regression ,Softmax regression and Newton's method

Softmax regression最優化後得到的參數有一個特點，就是所有的參數減去同一個值

後，他們還是最優的，有證明如下：

Logistic regression ,Softmax regression and Newton's method

這個說明了參數的解不是唯一的，我們還需要加一個規則項來修改cost函數：

Logistic regression ,Softmax regression and Newton's method

最後得到偏導數表達式為：

Logistic regression ,Softmax regression and Newton's method

至此說完這兩個回歸，個人覺得這裡還是有必要說一下牛頓法，

牛頓法可以用來求解f(x)=0的根，它的求解方法如下：設r是f(x)=0的根，選取x0作為r的初始近似值，過點(x0,f(x0)做曲線y=f(x)的切線L，L的方程為y=f(x0)+f'(x0)(x-x0)，求出L與x軸交點的橫坐标x1=x0-f(x0)/f'(x0)，稱x1為r的一次近似值。過點(x1,f(x1)做曲線y=f(x)的切線，并求該切線與x軸交點的橫坐标x2=x1-f(x1)/f'(x1),稱x2為r的二次近似值。重複以上過程直到誤差小于某個值。

而對于一個似然函數的最大值，我們可以選擇将這個似然函數的導數令做f(x)求其的0解來得到似然函數的最大值。

對于最一般的牛頓法，有：

Logistic regression ,Softmax regression and Newton's method

此時theta是一個向量，H是hessian矩陣。

這裡說一點牛頓法并不是對所有的f(x)試用，比如f(x)不連續就不可以使用。

Logistic regression ,Softmax regression and Newton's method

繼續閱讀

第四章：分類4.1 分類問題叙述4.2 為什麼線性回歸不可用4.3 Logistic Regression（邏輯回歸）4.4 線性判别分析（LDA）4.5 二次判别分析（QDA）4.6 分類方法的比較4.7 具體代碼實作（R語言版本）4.8 結語

Python k-均值聚類算法二維執行個體

OC語言--分類(category)

matlab 神經網絡 ANN 分類

機器學習中，有哪些特征選擇的工程方法？

Java實作樸素貝葉斯分類器

TensorFlow實作mnist書寫數字分類，出現please use urllib or similar directly錯誤。

Tensorflow-MNIST資料集分類簡單實作

監督學習--分類之決策樹監督學習-分類-決策樹

An Experimental Survey on Correlation Filter-based Tracking An Experimental Survey on Correlation Filter-based Tracking

Gaussian discriminant analysis and Gaussian Mixture Model

【RF分類】基于matlab随機森林算法資料分類【含Matlab源碼 2048期】

【機器學習】Softmax Regression和類别不平衡問題Logistic RegressionSoftmax Regression機器學習3.6節類别不平衡問題的學習

交叉熵損失函數原理詳解交叉熵損失函數原理詳解

非侵入式負荷監測（NILM）：分類與回歸，單目标與多目标回歸與分類單目标與多目标參考文獻

資料挖掘分類技術