損失函數：邏輯回歸損失函數推導簡記

2023-04-14 01:15:05

這裡隻推導邏輯回歸的損失公式。

假設函數

h θ ( x ) = 1 1 + e − θ T x (假設函數) h_\theta(x) = \frac{1}{1+e^{-\theta^Tx}} \tag{假設函數} hθ(x)=1+e−θTx1(假設函數)

用于二分類

KaTeX parse error: Undefined control sequence: \mbox at position 41: …\theta( x), & \̲m̲b̲o̲x̲{if }y=1 \\ (1-…

總結：如果我們取對數和負值，可以代表對應的成本函數。和似然函數相反的方向。（log隻是利于計算）。

KaTeX parse error: Undefined control sequence: \mbox at position 56: …theta( x)), & \̲m̲b̲o̲x̲{if }y=1 \\ -lo…

統一公式

我們找到聯合機率公式：

p ( y ∣ x , θ ) = h θ ( x ) y ⋅ ( 1 − h θ ( x ) ) 1 − y , (統一機率) p(y|x,\theta) = h_\theta( x)^{y} \cdot (1-h_\theta(x))^{1-y}, \tag{統一機率} p(y∣x,θ)=hθ(x)y⋅(1−hθ(x))1−y,(統一機率)

最大似然

最大似然就是最大化的所有樣本的機率公式：

L ( θ ) = ∏ i = 1 m p ( y i ∣ x i , θ ) (最大似然) L(\theta) = \prod_{i=1}^{m}p(y_i|x_i,\theta)\tag{最大似然} L(θ)=i=1∏mp(yi∣xi,θ)(最大似然)

對數-最大似然

對數最大似然就是最大化的所有樣本的機率公式：

L ( θ ) = ∑ i = 1 m l o g p ( y i ∣ x i , θ ) = ∑ i = 1 m [ y i l o g ( h θ ( x i ) ) + ( 1 − y i ) l o g ( 1 − h θ ( x i ) ) ] L(\theta) = \sum_{i=1}^{m}log p(y_i|x_i,\theta)= \sum_{i=1}^{m}[ {y_i} log(h_\theta( x_i))+{(1-y_i)}log(1-h_\theta( x_i))] L(θ)=i=1∑mlogp(yi∣xi,θ)=i=1∑m[yilog(hθ(xi))+(1−yi)log(1−hθ(xi))]

我們的目标是最大化似然函數。如果轉化為損失函數，那就是最小化。

損失函數J（loss function）

J = − 1 m L ( θ ) = − 1 m ∑ i = 1 m [ y i l o g h θ ( x i ) + ( 1 − y i ) l o g ( 1 − h θ ( x i ) ) ] J = -\frac{1}{m} L(\theta) \\ = -\frac{1}{m}\sum_{i=1}^{m}[{y_i} log h_\theta( x_i)+{(1-y_i)}log(1-h_\theta( x_i))] J=−m1L(θ)=−m1i=1∑m[yiloghθ(xi)+(1−yi)log(1−hθ(xi))]

##參數疊代公式

θ j : = θ j − α ∗ ∑ i = 1 m ( h ( x ( i ) − y ( i ) ) ( x j ( i ) ) \theta_j:=\theta_j - \alpha*\sum_{i=1}^{m} (h(x^{(i)}-y^{(i)})(x_j^{(i)}) θj:=θj−α∗i=1∑m(h(x(i)−y(i))(xj(i))

解釋：

參數第j個分量的更新，和每個樣例都有關系。
如果m取全部，則是用所有資料來更新分量j
m=1則是用一個執行個體來更新參數，也就是随機梯度下降。
更新的量，與速率、目前執行個體的j分量、誤內插補點（假設-目前）共同決定。

總結

一般的學習模型的三個重要步驟：

尋找h函數（即預測函數）；比如邏輯回歸的 f(w,b)；線性之後多了一個激活。
構造J函數（損失函數）；不同的損失函數，代表了不同的優化方向。比如：邏輯回歸如果用最小方差來作為評價函數，則容易導緻局部最優。
想辦法使得J函數最小并求得回歸參數（θ）；各種數值優化方法，随機梯度下降；牛頓法等。

簡稱：找目标、定方向、執行解決。

參考

https://blog.csdn.net/iterate7/article/details/76709492

損失函數：邏輯回歸損失函數推導簡記

假設函數

用于二分類

統一公式

最大似然

對數-最大似然

損失函數J（loss function）

總結

參考

繼續閱讀

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

極大似然法(ML)與最大期望法(EM)

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希

損失函數：邏輯回歸損失函數 推導簡記

假設函數

用于二分類

統一公式

最大似然

對數-最大似然

損失函數J（loss function）

總結

參考

繼續閱讀

損失函數：邏輯回歸損失函數推導簡記