天天看點

基于資料集細分及波段篩選的船隻檢測方法研究

作者:古淩

随着大陸經濟的飛速發展,海洋的資源開發與權益維護日益迫切,旅遊觀光、能源運輸、貿易進出口等對于海上運輸的依賴與日俱增。

船隻是海上活動的重要目标也是海上作戰與海上經濟建設的主體。船隻的正确檢測有助于實作船隻狀态監測以及分析,監控和打擊漁船非法捕撈,是船隻作業風險防控的基礎,同時能夠為海上資源調配以及貿易貨物等活動提供有力的技術支撐,極具理論意義和實用價值。

船隻目标檢測大量資料主要來源于遙感技術、SAR技術、紅外遙感技術無人機遙感技術、光學衛星成像技術等。

基于資料集細分及波段篩選的船隻檢測方法研究

紅外、SAR技術能夠實作在極端氣候條件下對船隻進行監控。可見光遙感影像提供了更豐富的船隻圖像資訊。無人機遙感成本較低、實時性強且靈活機動,具有作業周期短等特征。

同時,各類遙感技術也存在一些不足。

衛星遙感圖像分辨率較低且實時性較差,孔徑合成雷達光譜資訊不足,清晰度不高,與人類視覺存在差異。紅外成像技術成像效果容易受距離影響;無人機成像技術容易受到天氣、航程等影響但可以提供大量的細節且圖像分辨率較高。

基于資料集細分及波段篩選的船隻檢測方法研究

船隻目标檢測基本原理

相較于傳統船隻檢測方法,深度學習方法具有速度快、時效性強等優點。基于深度學習的船隻識别技術主要以卷積神經網絡為主,該網絡現已開發出多種成熟的目标檢測模型。

卷積神經網絡(CNN)是包含了卷積計算并且具有深度結構的前饋神經網絡。該網絡具有較好的表征學習能力,是以在目标檢測、圖檔分類、目标分割、目标跟蹤等相關計算機視覺領域應用廣泛且具有良好的表現。

包括輸入層(Input Layer)、卷積層(Convolutional Layer)、池化層(Pooling Layer)、全連接配接層 (Fully Connected Layer) 以及輸出層(OutputLayer) (圖3)。

基于資料集細分及波段篩選的船隻檢測方法研究

網絡資料輸入層的主要功能是對輸入的原始圖像進行預處理操作卷積層是最核心的部分,此層起到提取目标特征的用途。

卷積運算的本質便是離散二維濾波器(也叫卷積核)在圖像上滑動,曆遍圖中每一個像素點,并與對應點及其領域内的點做累積的過程。

在運算中需要用到以下參數,K(深度),即輸出的深度與卷積核數量一緻;S(步長),即滑動視窗每次移動的像素值般為1或2;零填充,即用0對輸入資料進行邊緣填充,圖檔高度;W:圖檔寬度;D:原始通道數,也是卷積核的個數;F:卷積核高寬大小(圖4、圖5)。

基于資料集細分及波段篩選的船隻檢測方法研究

圖2中,輸入圖像大小為4X4,卷積核大小3X3,步長1,輸出特征圖大小2X2。經卷積運算後,輸出特征圖變小。

對原圖邊緣進行零填充(圖4),其他條件保持不變,輸出特征圖大小為4X4,與原圖一緻,且所提取特征得以保留,這就是填充的作用。經卷積運算後,每層卷積産生參數大小為 D*F*F*K。

由此可知,在卷積運算過程中,有多個卷積核參與運算,進而會産生多個特征圖池化層(下采樣層)的作用主要為壓縮特征圖次元并且保持網絡空間不變形相當于對圖像進行resize操作,即過濾掉一些對目标檢測影響較小的資訊,有效減少了計算量。

基于資料集細分及波段篩選的船隻檢測方法研究

最大池化、平均池化以及随機池化為比較常見的池化方法。

最大池化是對區域内的最大值進行選取;平均池化即對區域内進行平均值選取;随機池化即對區域内進行随機值選取。相較于随機池化,最大池化與平均池化更為常用(圖6、圖7)。

基于資料集細分及波段篩選的船隻檢測方法研究
基于資料集細分及波段篩選的船隻檢測方法研究

全連接配接層将卷積層和池化層提取的特征進行整合并輸送到檢測器,一般在網絡的後幾層,每個神經網絡根據任務不同有一個或幾個全連接配接層,以最後一個全連接配接層輸出的特征來作為分類的依據。一般輸出為一組一維向量。

常用的分類器有Softmax 函數和SVM(支援向量機),相較于SVM,Softmax函數具有多分類的功能,同時分類效果也比較好,是以通常情況下Softmax函數作為最常用的分類器(式1)。

基于資料集細分及波段篩選的船隻檢測方法研究

式中,N代表類别數,S為輸出矩陣,aj表示a類别中第j個元素,1XN代表次元,表示網絡輸出N個類别的機率。

Softmax Loss的計算公式如下(式2):

基于資料集細分及波段篩選的船隻檢測方法研究

式中,yj表示此次檢測是否為第j個類的真實值。若非真實類别則yj取0。卷積神經網絡中在卷積層之後要引入非線性元素,即激活函數。該函數的主要作用就是防止出現梯度爆炸的現象發生。

目前使用最廣泛的就是ReLU激活函數,其計算原理是保留響應大于零的結果,而小于零的結果則全部記為零(式3)。

基于資料集細分及波段篩選的船隻檢測方法研究

該函數增大了矩陣的稀疏性,進而使得生成的模型也具有更好的泛化能力。

同時,ReLU激活函數在訓練過程中的梯度變化穩定,不随輸入幅度的變化而變化,避免了sigmod等函數中出現的“梯度消失”的問題(圖8)。

基于資料集細分及波段篩選的船隻檢測方法研究

典型分類卷積神經網絡模型

常用模型有AlexNetls、VGGNet、GoogleNet、ResNet。這四種模型都是挑戰ImagNet而産生的。

AlexNet由Alex Krizhevsky 在2012年首次提出,并在ImagNet大賽中一舉奪魁。該模型由5 個卷積層和3個全連接配接層組成,前兩層卷積層卷積核大小分别為11X11、5X5,對應步長分别為4、1。後三層卷積層均使用3X3的卷積核,步長為1。網絡結構如下(圖9)。

基于資料集細分及波段篩選的船隻檢測方法研究

該模型具有以下特點:

一是首次使用ReLU函數,避免了其他函數出現的梯度消失的問題;

二是對資料進行增強,并首次引入dropout層,有效避免模型過拟合的同時增強了模型的泛化能力。

VGGNet在2014年由牛津大學著名研究組VGG (Visual Geometry Group)提出,并在ImagNet 大賽中分别獲定位任務第一名和分類任務第二名。

以VGG16為例,該網絡除池化層與Softmax層外一共16層,卷積核均為3X3大小,池化層采用最大池化法,池化核大小為2X2,步長為2。該模型網絡結構如圖(圖10、圖11)。

基于資料集細分及波段篩選的船隻檢測方法研究

該模型的特點如下:

一是相較于AlexNet,該模型網絡層數由8層增加到了16層,使得提取的特征資訊更加豐富;

二是使用3X3小卷積核很好的縮減了參數量,提高了模型訓練效率;

三是池化核變小且為偶數,減小了資訊損失。

基于資料集細分及波段篩選的船隻檢測方法研究

該模型采用了9個子產品化的結構,共22層,友善學者的添加和修改且參數量僅為AlexNet模型的一半。

增加了2個輔助的分類器有效避免了深層網絡梯度消失現象發生;增加了多種卷積核;移除了全連接配接層使用平均池化層來代替,最後增加一個全連接配接層友善後續的模型遷移。

通過上述一系列操作,該模型有效避免了網絡越深參數越多梯度易消失的問題。該模型結構如圖12 所示。

基于資料集細分及波段篩選的船隻檢測方法研究

VGGNet與GoogleNet模型顯示出,網絡深度越深則模型表現越好,但在實踐過程中發現,在網絡達到一定深度後,更深的網絡中梯度消失現象就越明顯,出現更高的訓練誤差進而導緻訓練和測試的效果變差。

ResNet很好的解決了這一問題,其核心便是殘差網絡(圖13)。

由圖可知,網絡中加入 identity mapping,很好的解決了梯度消失的現象上述卷積神經網絡模型各有千秋,GoogleNet、ResNet是深層複雜的卷積神經網絡。

基于資料集細分及波段篩選的船隻檢測方法研究

但針對少量資料的資料集,使用深層複雜的神經網絡會産生大量的參數以及資料,極易出現模型容量過剩的情況,進而導緻模型過拟合的現象發生。

相較于AlexNet,VGGNet用多層小卷積核代替了AlexNet中大卷積核,加強了網絡局部特征提取能力。

基于SSD算法船隻檢測的理論基礎

二階段算法雖然檢測精度越來越高,但是檢測速度提升起來比較困難,是以在部分場景上的實時性表現差強人意。

一階段算法在保證一定準确率的基礎上,檢測速度較快。且本文船隻樣本資料量相對較少。由上文可知,少量樣本時VGGNet模型檢測效果相對較好,該算法以截斷的VGG-16網絡為基礎骨于網絡,同時該算法為一階段目标檢測應用最廣泛的算法。

SSD算法是基于前饋卷積網絡,産生固定大小的預選框集合,且為預選框中對象類執行個體進行評分,并利用非極大抑制生成最終檢測結果的一種深度學習算法。算法結構如圖14所示。

基于資料集細分及波段篩選的船隻檢測方法研究

SSD算法對傳統VGG-16網絡進行了改造,删除了VGG-16網絡最後的池化層和全連接配接層,并且用2個卷積層conv3-1024以及conv1-1024來替代,使得特征圖通道由512變為1024并保持不變。

在網絡後加入extra layers,該部分共包含8個卷積層,此操作使得原網絡最後輸出的 19X19X512的特征圖經過卷積後變為1X1X256的特征圖。

SSD網絡使用不同深度的卷積層預測不同大小的目标,對于小目标檢測使用較低層,大目标通過較高層檢測。由前面各種尺度的特征層共同産生最後一層檢測(圖15)。

基于資料集細分及波段篩選的船隻檢測方法研究

SSD算法借鑒了RPN網絡的預設候選框機制以及回歸機制,同時也采用了多尺度特征表征的思想進行目标檢測,進而使得該算法同時兼具檢測速度快精度高的特點。

由于使用特征層進行預測的機制,最終會産生大量錯誤重疊甚至不正确的候選框,是以需要非極大抑制法(NMS,non maximum suppression)來優化,按照得分(類别機率值)對檢測框排序。不斷的疊代保留高品質檢測框并輸出。

參考文獻:

[1]. 《中國海洋生态環境保護的創新思路》

[2]. 《無人機遙感在第三次國土調查中的應用實驗》

[3]. 《基于遙感圖像的船舶目标檢測方法綜述》