深度學習筆記-卷積神經網絡基礎

2023-06-11 03:04:08

組成

一個簡單的卷積神經網絡是由各種層按照順序排列組成的，網絡中每個層使用一個可微分的函數将資料從一層傳遞到下一層，通常卷積神經網絡主要由五種類型的層組成：卷積層、批正則化層、非線性映射層、池化層、全連接配接層等。通過将這些層疊加起來，就可以建構出一個完整的卷積神經網絡，最後在根據任務的不同定義不同的函數。

深度學習筆記-卷積神經網絡基礎

卷積運算

卷積運算是卷積神經網絡中最基本的組成部分，計算過程就是元素乘積求和。卷積運算可采用合适的卷積核（過濾器、濾波器，英文為fliter）實作垂直邊緣的檢測。本身卷積核就好像一個孔徑大小一緻的過濾器一樣，篩選出不能通過去的物質。是以卷積核本身就有特征，可以是垂直檢測，也可以是水準邊緣檢測，通過修改卷積核中的參數，可以做到任意角度的邊緣檢測。

卷積運算有兩個缺點：

1.随着卷積的次數不斷增加，圖像的尺寸會越來越小；

2.圖像中處于角落的像素在運算時候由于參與運算的次數隻有一次，是以該像素将會丢失。

為了解決上述的兩個問題，在原來像素的基礎在外圍添加像素層數，不僅可以增加圖像的尺寸還可以增加邊緣像素參與運算的次數。其中填充的層數稱為padding。NXn尺寸的圖像乘以f*f卷積核的運算，得到（n-f+1）X（n-f+1）的新圖像。Padding的中文意思就是填充。

6.過濾器一般都是設計成奇數的，有兩點原因：1.這樣的話padding取值是對稱的；2.過濾器有一個中心參數。

7.步長S的定義就是說過濾器在移動過程中是每兩步移動一下，包括水準移動和垂直移動。也就是說每連續移動兩步就會輸出一個資料，這樣的例子中步長就是2。

8.N:定義為圖像的尺寸邊長；f:定義為過濾器的尺寸邊長；p:定義為增加的層數；s:步長，最後得到的圖像尺寸的計算公式為：（）*（）

7.圖像在計算機中就是由很多很多像素組成的，每個像素對應一個數，是以圖像可以當做一個矩陣，在處理過程中其實就是對它的像素進行處理，比如進行矩陣運算。

8.卷積運算不僅可以應用在平面(二維)圖像上，也就是黑白圖，隻有兩種顔色，也可以運用在三維的圖像上，所謂的三維圖像其實就是RGB、彩色圖像，它是由三通道的顔色組成的，是以我們可以将一張彩色圖看成由三張圖疊加而成的，分别是紅綠藍三張圖。

9.在卷積運算中，彩色圖是要跟一個三維的過濾器進行乘積的，這個三維過濾器其實就是為了對應彩色圖中紅綠藍三個通道的。

11.輸出圖像的通道數等于過濾器的數量。

12.在進行卷積運算之後得到的最後圖像進行輸出，将高乘以寬再乘以通道數記得到所有特征，将這些特征排列成一列輸出，也就是列向量，然後在輸入到softmax填充函數中。

13.在進行多次卷積運算中，圖像的尺寸會逐漸減小，通道數會逐漸增加。一個經典的卷積神經網絡通常有三層，一個是卷積層，一個是池化層，最後是全連接配接層。

14.池化層其中含有最大池化層，它與卷積層的差別在于卷積運算的不同，輸出圖像的尺寸計算公式是一樣的，池化層選取過濾器内含有特征的值，比如最大值，平均值，分别代表着池化層中的最大池化層和平均池化層。

15.卷積運算過程中的參數不僅包含了過濾器中的參數，還包含了一個輸出的矩陣存在的偏差，這個偏差也是一個參數。

9.典型神經網絡有LeNet-5、AlexNet、VGG-16。

深度學習筆記-卷積神經網絡基礎

組成

卷積運算

繼續閱讀

yolov7 tensorrt模型加速部署【實戰】

Android-opencv之CVCamera

基于ORB特征點比對的對極幾何限制實作（源碼+講解）

使用hector構圖_如何使用均衡的構圖拍攝更清晰的照片

GMS：基于網格運動統計的快速極度魯棒的特征比對摘要1 簡介2 本文的方法3 應用于快速記分的網格架構4 實驗 5 結論

如何使用前景和背景建立更清晰的照片

在Ubuntu16.04上提取相鄰序列圖像之間的ORB的特征點，并用暴力方法找到比對點并連線一、什麼是ORB特征二、什麼是暴力比對三、實作代碼四、運作方法

Matlab中将二維灰階圖像三維顯示

車道線檢測

自監督｜「CoCLR」視訊自監督對比學習筆記

視訊對象分割（Video Object Segmentation）研究小記任務定義與資料集技術路線分類基于神經網絡的模型總結

opencv視覺跟蹤——消除背景模組化

圖形處理單元(GPU)的演進

2021-09-30三維點雲測量正方形包裹體積

DOG算子

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡