常用卷積神經網絡 -- ResNet

2023-06-20 21:53:16

在計算機視覺中，往往越深的網絡，特征越多，能夠訓練更好的模型。而非常非常深的神經網絡是很難訓練的，因為存在梯度消失和梯度爆炸問題。通過在一個淺層網絡基礎上疊加y=x的層（稱identity mappings，恒等映射），可以讓網絡随深度增加而不退化。但為了訓練更好的網絡，何恺明等人提出了殘差網絡(ResNet)。根據他的假設：如果對某一網絡中增添一些可以學到恒等映射的層組成新的網絡，那麼最差的結果也是新網絡中的這些層在訓練後成為恒等映射而不會影響原網絡的性能。ResNets是由殘差塊Residual block建構的。

1、殘差塊

常用卷積神經網絡 -- ResNet

設輸入為x。假設圖中最上方激活函數輸入的理想映射為f (x)。左圖虛線框中的部分需要直接拟合出該映射f (x)，而右圖虛線框中的部分需要拟合出有關恒等映射的殘差映射f (x) − x。resnet學習的就是殘差函數F(x) = H(x) - x。

ResNet沿用了VGG全3 × 3卷積層的設計。殘差塊裡首先有2個有相同輸出通道數的3 × 3卷積層。每個卷積層後接一個批量歸一化層和ReLU激活函數。然後我們将輸入跳過這兩個卷積運算後直接加在最後的ReLU激活函數前。這樣的設計要求兩個卷積層的輸出與輸入形狀一樣，進而可以相加。如果想改變通道數，就需要引入一個額外的1 × 1卷積層來将輸入變換成需要的形狀後再做相加運算。

2、ResNet模型

ResNet的前兩層跟GoogLeNet中的一樣：在輸出通道數為64、步幅為2的7 × 7卷積層後接步幅為2的3 × 3的最大池化層。不同之處在于ResNet每個卷積層後增加的批量歸一化層。GoogLeNet在後面接了4個由Inception塊組成的子產品。ResNet則使用4個由殘差塊組成的子產品，每個子產品使用若幹個同樣輸出通道數的殘差塊。第一個子產品的通道數同輸入通道數一緻。由于之前已經使用了步幅為2的最大池化層，是以無須減小高和寬。之後的每個子產品在第一個殘差塊裡将上一個子產品的通道數翻倍，并将高和寬減半。

常用卷積神經網絡 -- ResNet

常用卷積神經網絡 -- ResNet

繼續閱讀

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普