![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbwxCdh1mcvZ2LcV2Zh1Wa9M3clN2byBXLzN3btg3P3pVdC5GTwUUbOdXTtl1aGpXWyU0RP1GaUpVNwknTyUEROpXWE9Ee4k3YsR2VZRHbyg1aGJjYzJEWkZHOXFWdVhUY6VzVZBHctxkeWJjWoFzVhRXUXlld4d0YxkTeMZTTINGMShUYvwlbj5yZtlmbkN3YuQnclZnbvN2Ztl2Lc9CX6MHc0RHaiojIsJye.jpg)
1. 介紹
圖像去模糊一直以來都是計算機視覺和圖像處理領域内的一個重要問題。給定一張因運動或失焦而模糊(由相機搖晃、目标快速移動或對焦不準而造成)的圖像,去模糊的目的是将其恢複成有清晰的邊緣結構和豐富真實的細節的圖像。
圖像去模糊是從粗糙到精細(coarse-to-fine)的過程,在傳統方法與基于深度學習的方法中,一般使用金字塔結構中不同分辨率逐漸去重建得到清晰的圖像,這篇文章也是使用這樣的方式進而提出了一個新的模糊去除方法Scale-recurrent Network(SRN-DeblurNet)。相比一些現有的方法其具有結構簡單、參數量少、且容易訓練的特點,性能也是比較好的。
2. 圖像進行中的網絡結構
上圖中的前3幅圖展示了圖像處理的不同CNN網絡結構,圖(a)中是經典的U型結構,這個結構是文章算法采用了的;圖(b)是級聯形式的網絡,文章采用參數共享的網絡來減少參數與訓練的難度,此外文章在級聯出使用LSTM之類的網絡進行特征提取,更好重建清晰圖;圖(c)是使用膨脹卷積的網絡,這樣回增大網絡的感受野。而文章是将這些網絡設計中的優點內建,進而得到這篇文章的網絡結構SRN,見圖(d)所示。
3. 網絡設計
3.1 網絡結構
文章的網絡結構見下圖所示,它是一個由多個尺度圖像輸如建構的多層網絡,類似于建構一個重構金字塔,逐級優化進而得到最後的重建清晰圖。具體的網絡結構見具體原文所示。
3.2 Scale-recurrent Network(SRN)
在網絡中的中間資料 h i h^i hi與輸出資料 I i I^i Ii其重構的數學表達為:
其中,i=1代表的是最好的尺度,也就是分辨率最大的層級, B i B^i Bi, I i I^i Ii是不同層級的模糊圖與重建之後的圖像, N e t S R Net_{SR} NetSR是重建網絡, θ S R \theta_{SR} θSR是網絡中的參數。
在公式1中已經描述了網絡的大緻結構,除此之外網絡還有一些可以靈活設計的部分:
- 網絡中的循環網絡部分,可供選擇的有RNN、LSTM、GRU,文章裡面從實際的效果上選擇的是ConvLSTM;
-
對于上采樣操作的選擇,可選的有deconvolution layer、sub-pixel
convolution與圖像resize,文章裡面選用的是雙線性內插補點方式;
3.3 使用ResBlocks的編解碼器
3.3.1 編解碼網絡
編解碼結構的U型網絡在實際中有廣泛使用,但這樣的結構對于這篇文章所要處理的任務來說就有點并不是适合,主要的原因有:
- 對于去模糊的任務,感受野需要很大才能處理嚴重模糊的情況,這就導緻了需要增加網絡的層數,但會帶來大量的參數與中間特征,而且中間的特征分辨率過小也無法有效複原清晰圖像;
- 在編解碼器中添加過多的卷積操作會使得網絡轉換的效率下降;
- 文章的結構中間采用了循環網絡;
3.3.2 編解碼器中的ResBlock
在本論文中,我們将表明直接應用已有的編碼器-解碼器結構不能得到最優結果。相對而言,我們的編碼器-解碼器 ResBlock 網絡會放大各種 CNN 結構的優勢并實作訓練的可行性。同時,這還會産生非常大的感受野,這對運動模糊很大的圖像的去模糊至關重要。
對于上面|問題文章設計了兩個基礎網絡block:Encoder ResBlocks(EBlocks) 與 Decoder ResBlocks(DBlocks),他們兩個是呈現互相對稱的形式,這些子產品的stride為2。
對于網絡引入循環網絡,這裡将公式1的描述進行了修改,則添加了循環網絡的描述為:
3.4 網絡的損失函數
網絡的損失函數采用的是 L 2 L_2 L2損失函數,這個損失函數在一些精度要求不高的場景下可以使用,其固有的性質會使得重建結果模糊化,丢失高頻資訊,其損失函數定義為( k i = 1.0 k_i=1.0 ki=1.0):
4. 實驗結果
網絡的總體性能:
多尺度重建對于性能的影響: