交叉熵損失cross entropy loss

2023-03-26 06:37:32

我們一般在回歸問題中，損失函數經常會用到MSE（mean squared error），而在分類問題中，我們經常會用到CrossEntropy。我們經常把它與softmax一起用，因為我們用交叉熵計算出來的值不一定是在[0,1]之間，我們通常用softmax歸一到0-1之間，這樣我們可以進行物體的分類。

這裡，yi是預測值，y’i是label

我們為什麼要使用交叉熵呢？

比如我們給你兩組資料

交叉熵損失cross entropy loss

那麼我們正常計算table1，2的準确率都是33.3%，但是我們仔細觀察，table2的明顯要比table1要好，因為0.8-0.1-0.1估計錯的機率明顯要比

0.3-0.4-0.3估計錯誤的機率要大，那麼我們怎麼才能看出哪一個模型效果更好呢？

我們用crossentropy來計算loss：

table1：第一項：- ((ln0.2)*0+(ln0.2)*0+(ln0.6)*1) = -ln0.6

同理，table1：loss = -（ln0.6+ln0.4+ln0.1）/3 = 1.243

table2：loss = -(ln0.6+0.4+0.3) = 0.877

那麼我們明顯看出來table2要比table1更好。

我們用MSE來計算loss：

table1：第一項：（0.2-0)^2+ (0.2-0)^2 +(0.6-1)^2 = 0.24

同理：table1：loss = （0.24+0.54+0.06）/3 = 0.28

table2：loss = （0.24+0.54+0.74）/3 = 0.507

這樣看來MSE也很好啊

如果用 MSE 計算 loss，通過 Softmax後輸出的曲線是波動的，有很多局部的極值點，即非凸優化問題 (non-convex)

而用 Cross Entropy Loss 計算 loss，就還是一個凸優化問題，用梯度下降求解時，凸優化問題有很好的收斂特性。

分類問題最後必須是 one hot 形式算出各 label 的機率，然後用max 選出最終的分類。最開始我們講到，在計算各個 label 機率的時候，用的是 softmax 函數。

softmax：

交叉熵損失cross entropy loss

假設你的輸入S=[1,2,3]，那麼經過softmax層後就會得到[0.09,0.24,0.67]，這三個數字表示這個樣本屬于第1,2,3類的機率分别是0.09,0.24,0.67。

參考：https://blog.csdn.net/xg123321123/article/details/80781611

https://www.jianshu.com/p/47172eb86b39

交叉熵損失cross entropy loss

繼續閱讀

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普