經典卷積神經網絡之VggNet

2023-07-31 14:07:59

當卷積神經網絡被提出來之後，我們一直想要探讨的問題就是卷積神經網絡的深度，深度越深代表模型越複雜，但是其訓練難度也會加大，那麼卷積神經網絡到底可以有多深，是不是越深越好。為此在2014年，由牛津大學計算機視覺組和DeepMind公司，提出了VggNet網絡結構，這是一種結構層次比較深的卷積神經網絡架構。

網絡架構：

經典卷積神經網絡之VggNet

我們可以看到上圖中的VggNet有六種結構，分别是：A、A-LRN、B、C、D、E，他們之間最大的差別就是連續卷積的次數，同時在A-LRN中使用到的LRN表示的是Local Response Normalization，也就是局部響應歸一化層，在C中使用到了 1 × 1 1\times1 1×1卷積，這種結構的卷積主要的目的就是降低次元，減少計算參數，在之後的許多網絡結構當中都使用到了 1 × 1 1\times1 1×1卷積。

下面在Tensorflow的環境下，搭建VggNet中的A級别的架構：

import tensorflow as tf
from tensorflow.keras import layers
# 輸入層
input = layers.Input((224, 224, 3))
# 卷積層1
conv1 = layers.Conv2D(64, 3, 1, padding="same", activation="relu")(input)
pool1 = layers.MaxPool2D(3, 2, padding="valid")(conv1)
# 卷積層2
conv2 = layers.Conv2D(128, 3, 1, padding="same", activation="relu")(pool1)
pool2 = layers.MaxPool2D(3, 2, padding="valid")(conv2)
# 卷積層3
conv3 = layers.Conv2D(256, 3, 1, padding="same", activation="relu")(pool2)
conv3_2 = layers.Conv2D(256, 3, 1, padding="same", activation="relu")(conv3)
pool3 = layers.MaxPool2D(3, 2, padding="valid")(conv3_2)
# 卷積層4
conv4 = layers.Conv2D(256, 3, 1, padding="same", activation="relu")(pool3)
conv4_2 = layers.Conv2D(256, 3, 1, padding="same", activation="relu")(conv4)
pool4 = layers.MaxPool2D(3, 2, padding="valid")(conv4_2)
# 卷積層5
conv5 = layers.Conv2D(256, 3, 1, padding="same", activation="relu")(pool4)
conv5_2 = layers.Conv2D(256, 3, 1, padding="same", activation="relu")(conv5)
pool5 = layers.MaxPool2D(3, 2, padding="valid")(conv5_2)
# 展平
flatten = layers.Flatten()(pool5)
# 全連接配接層1
dense1 = layers.Dense(4096, activation="relu")(flatten)
# 全連接配接層2
dense2 = layers.Dense(4096, activation="relu")(dense1)
# 輸出層
output = layers.Dense(1000, activation="softmax")(dense2)
# 産生模型
model = tf.keras.Model(inputs=input, outputs=output)
# 列印模型
print(model.summary())

經典卷積神經網絡之VggNet

我們可以看到VggNet的結構相比于LeNet-5以及AlexNet，它結構的深度更深，并且采用了連續卷積的結構（之前我們一般在一個卷積之後就會跟上一個池化層），同時它也采用了 1 × 1 1\times1 1×1的卷積。可以看出VggNet想要探索卷積神經網絡的深度到底可以有多深，是不是越深就越好，但是它的網絡結構還是順序的堆疊。

經典卷積神經網絡之VggNet

繼續閱讀

《eWEEK》：09年5大科技發展趨勢雲計算居首

《正在爆發的網際網路革命》

淺談使用Fiddler工具進行弱網測試

linux網絡程式設計----發送與接收檔案

深度學習模型分析人類複雜疾病的準确性

人工智能如何有效地運用于自然語言處理

PHP進階學習之session寫入資料庫

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

手動安裝Intel network I217-LM網卡的Linux驅動

XX系統實施過程問題總結

nginx 安裝錯誤資訊解決

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？