L1正則化進行稀疏選擇的數學解釋

2023-05-08 17:49:59

令 L ( w ) = l 0 ( w ) + λ ∑ ∣ w i ∣ L(w)=l_0(w)+\lambda\sum|w_i| L(w)=l0(w)+λ∑∣wi∣，

則 ∂ L ( w ) ∂ w i = ∂ l 0 ( w ) ∂ w i + λ s i g n ( w i ) \dfrac{\partial L(w)}{\partial w_i}=\dfrac{\partial l_0(w)}{\partial w_i}+\lambda sign(w_i) ∂wi∂L(w)=∂wi∂l0(w)+λsign(wi)。

由于 λ s i g n ( w i ) \lambda sign(w_i) λsign(wi)在0的左右兩側分别取值為 − λ -\lambda −λ和 λ \lambda λ，

是以當 ∣ λ ∣ |\lambda| ∣λ∣足夠大時（ > ∣ ∂ l 0 ( w ) ∂ w i ∣ >|\dfrac{\partial l_0(w)}{\partial w_i}| >∣∂wi∂l0(w)∣）， ∂ L ( w ) ∂ w i \dfrac{\partial L(w)}{\partial w_i} ∂wi∂L(w)在0的左右兩側将異号，則0是 L ( w ) L(w) L(w)的一個局部極小值點，在凸優化中即是一個全局最小值點。

L1正則化進行稀疏選擇的數學解釋

繼續閱讀

克魯斯卡爾算法（Kruskal）求最小生成樹（MST)過程詳解

從 C 代碼到可執行程式的 4 步之旅Journey of a C Program to Linux Executable in 4 Stages

深入了解Magento – 第六章 – 進階Magento模型

一維數組冒泡排序

内排序（五）——快速排序

IDEA+建立Maven多子產品springboot項目

What Operating Systems Do

數組集合操作數組MapSet正則

循環字元串問題中的翻手算法

安裝hadoop 問題記錄1.安裝hadoop 報錯2.hadoop 執行個體運作3.總結4. mysqlzsh: command not found: service 解決方案5.hive

群論學習_待補_Poj 3372 Candy Distribution群論學習

模型選擇之特征選擇

gcc 編譯過程中頭檔案的查找路徑

關于長連接配接和短連接配接的了解及使用場景關于長連接配接和短連接配接的了解及使用場景

怎麼避免過拟合（正則化，droupout,bagging等原理及特點介紹）1.正則化2.Droupout3.Bagging參考文獻

PHP 構造函數和析構函數意義所在