經典DL論文研讀(part2)--Deep Sparse Rectifier Neural Networks

2022-06-02 20:41:25

學習筆記，僅供參考，有錯必糾

文章目錄

Deep Sparse Rectifier Neural Networks

Abstract
Introduction
Background
Deep Rectifier Networks
Experimental Study

Image Recognition
實驗結果
稀疏性實驗結果
半監督與監督學習

Conclusion

Deep Sparse Rectifier Neural Networks

Abstract

本文提出一種RELU激活函數，該激活函數可以激發稀疏性，可以獲得與雙曲正切函數(Tanh)等同,甚至更好的效果.

經典DL論文研讀(part2)--Deep Sparse Rectifier Neural Networks

Introduction

計算神經模型和機器學習中的神經網絡具有一定的差異. 這種差異可以被RELU激活函數消除.

Background

The main gaps that we wish to consider between computational neuroscience models and machine learning models are the following:

大腦中神經元隻有少部分(1%-4%)處于工作狀态，也就是有稀疏性。如果不使用L1正則化，則神經網絡很難達到稀疏的狀态。
一種常見的生物學模型 leaky integrate-and-fire(LIF)如下所示

經典DL論文研讀(part2)--Deep Sparse Rectifier Neural Networks
輸入電流與 firing rate的關系圖如下所示，可以看到，當電流較小時，firing rate一直為0；當輸入電流達到一定程度時，firing rate的值才大于0；随着電流越大，firing rate逐漸增長，但是增長速率也在逐漸降低.

Deep Rectifier Networks

本文提出一種RELU激活函數，當輸入信号到達門檻值時，該激活函數才會非0. 下圖中的右圖為RELU激活函數圖，左圖為應用了RELU激活函數的神經網絡結構，可以看到當使用RELU激活函數時，部分神經元的輸出為0，則此時神經網絡具有系數性…

Experimental Study

Image Recognition

實驗結果

實驗中，在4個資料集上使用3個激活函數，并分别采用使用無監督預訓練(受限玻爾茲曼機：Restricted Boltzmann machines)和不使用無監督預訓練的方式進行實驗. 由結果可知，利用RBF對模型進行預訓練對基于RELU激活函數的神經網絡影響不大. 同時，使用RELU激活函數，可以得到與使用Tanh匹敵，甚至更好的結果.

稀疏性實驗結果

下圖中，橫坐标為稀疏度，縱坐标為錯誤率. 可以看出當系數率在[75%, 85%]的範圍内，錯誤率較低，但是随着稀疏度的增高，錯誤率逐漸上升.

半監督與監督學習

針對RELU激活函數來說，在半監督情況下，預訓練會得到很好的模型性能提升效果. 但是随着标簽數量的上升(監督學習)，是否對模型進行預訓練的效果将沒有顯著差別.

Conclusion

RELU激活函數可以在不使用預訓練的情況下，提高模型的性能，以獲得更好的結果.

經典DL論文研讀(part2)--Deep Sparse Rectifier Neural Networks

文章目錄

Deep Sparse Rectifier Neural Networks

Abstract

Introduction

Background

Deep Rectifier Networks

Experimental Study

Image Recognition

實驗結果

稀疏性實驗結果

半監督與監督學習

Conclusion

繼續閱讀

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

通俗了解查準率(precision)和查全率(recall)

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

人工智能如何有效地運用于自然語言處理

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡