【機器學習】激活函數和代價函數

2023-04-26 10:36:58

【激活函數】

如果沒有激活函數，那麼神經網絡模型就是一個線性模型；即便有再多的隐藏層，整個網絡也隻能等價于一個單層的神經網絡。有了激活函數以後，神經網絡就能模組化非線性模型，能廣泛處理複雜的問題。

階躍函數：最早采用的激活函數是階躍函數，但其光滑性不好，是以實際中用光滑性較好的函數替代。

【機器學習】激活函數和代價函數
Sigmoid函數：Sigmoid函數具有可微性和單調性，輸出值的範圍是(0,1)，在實體意義上最接近生物神經元。但Sigmoid函數也有缺點，例如：飽和性。根據sigmoid函數的定義不難看出，當x趨向于兩側時，sigmoid函數的導數逐漸趨向于0，在參數更新中，需要代價函數關于參數的偏導數資訊，這些偏導數中都會含有一個因子——激活函數的導數，如果取sigmoid函數為激活函數，一旦輸入值落入飽和區域，那麼sigmoid函數的導數值就會很小，甚至接近于0，進而使得代價函數關于參數的偏導數很小，參數就無法更新，還有導緻向下一層傳遞的梯度非常小，這種現象稱為梯度消失，會使得整個網絡的參數難以得到有效的訓練。

【機器學習】激活函數和代價函數
雙曲正切函數(Tanh函數)：也具有可微性和單調性，輸出值的範圍是(-1,1)，輸出均值是0。這就使得在某些計算中收斂速度比sigmoid函數快，減少疊代次數，不過雙曲正切函數同sigmoid函數一樣，也具有飽和性，會造成梯度消失。

【機器學習】激活函數和代價函數
ReLU函數：ReLU函數是線性整流單元的簡稱，它是針對激活函數飽和性的缺點而提出的。在正半軸上，ReLU函數不存在飽和問題，是以ReLU函數能保持梯度不衰減，緩解梯度消失問題。然而在小于0的區域同樣會導緻對應權重無法更新，稱這種現象為“神經元壞死”，由于神經元壞死會影響神經網絡的收斂性，是以提出了各種ReLU函數的變體。

【機器學習】激活函數和代價函數

【代價函數】

均方誤差函數：形式簡單、通俗易懂，就是真實值和預測值的平方差之和，但容易出現飽和現象，容易陷于局部極值，改進的方法是采用交叉熵作為代價函數。

【機器學習】激活函數和代價函數
交叉熵損失函數：多用于分類問題，交叉熵刻畫的是實際輸出（機率）與期望輸出（機率）的距離，也就是交叉熵的值越小，兩個機率分布就越接近。采用交叉熵作為代價函數後，如果誤差越大，則修正項就越大，參數更新就越快，訓練速度也越快。

【機器學習】激活函數和代價函數
假設機率分布p為期望輸出(标簽)，機率分布q為實際輸出，H(p,q)為交叉熵。

【機器學習】激活函數和代價函數

參考資料：

1.https://blog.csdn.net/lilong117194/article/details/81542667

2.機器學習與人工智能-浙江大學-中國大學mooc

【機器學習】激活函數和代價函數

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

【機器學習】 激活函數和代價函數

繼續閱讀

【機器學習】激活函數和代價函數