超分辨率能夠克服或補償由于圖像采集系統、采集環境本身限制而導緻的成像模糊、圖像品質低下等問題,提升圖像分辨率,為特征提取、資訊識别等圖像的後續處理提供重要支援。
2010 年 12 月,清華大學電子工程系蘇教授接到一通不尋常的電話,内蒙古自治區準格爾刑警隊的警員拿着一張模糊不清的犯罪嫌疑人人臉圖像,向蘇光大尋求幫助。
「這張圖像是由路邊的監控攝像頭拍攝的,像素非常低,肉眼完全無法辨認。」蘇光大回憶道,當時他利用超分辨率技術,将這張模糊的圖像放入他們研發的軟體中進行了重建,準格爾警方依據重建後的高清晰度圖像,很快便鎖定了嫌疑人,并破獲了這起兇殺案。
事實上,該案件并非個例。警方在偵破案件時,通過監控攝像頭可以得到犯罪嫌疑人相關圖像,加快破案速度。然而,監控攝像頭拍攝的照片放大後常常出現細節模糊的問題,這大大降低了警方擷取關鍵證據的效率。
随着超分辨率技術的發展,這些問題迎來了轉機并逐漸被解決。
本文将從概念入手,介紹超分辨率的主流算法及其優缺點,并展示了其在公共安防、醫學診斷、衛星遙感、數字娛樂等不同場景下的應用。
什麼是超分辨率?
超分辨率 (Super-Resolution, SR),簡單來說,就是将低分辨率 (low resolution, LR) 的圖像通過算法提升到高分辨率 (high resolution, HR)。相較于低分辨率圖像,高分辨率圖像擁有更大的像素密度和更豐富的紋理細節,具備更高的可信賴度。
圖源:SUPIR 官網
這種技術可以克服或補償由于圖像采集系統或采集環境本身的限制而導緻的成像模糊、圖像品質低下等問題,在特征提取、資訊識别等圖像的後續處理上提供了重要支援。
超分辨率算法分類
目前,超分辨率方法主要分為三類:基于插值的方法、基于重構的方法和基于學習的方法。
* 基于插值的方法
插值法通過在圖像原有的像素周圍插入新像素來加大圖像的尺寸,并給這些像素指派,進而恢複圖像内容,達到提高圖像分辨率的效果。
*像素:組成圖像的最基本單元要素,即點,每個像素點都有自己的顔色值,機關面積上像素點越多,圖檔越清晰。
* 基于重構的方法
基于重構的超分辨算法,通常是用多幅在同一場景下拍攝的低分辨率圖像作為輸入,然後對這些圖像的頻域或空域關系進行分析,通過引入先驗資訊對重建過程進行指導和限制,進而重建得到單張高分辨率圖像。
*頻域:是指信号在頻率域上的特征。
*空域:是指信号在空間上的分布情況。
*先驗資訊:這種資訊是在「試驗之前」就已有的,一般可了解為領域知識。
* 基于學習的方法
基于學習的超分辨率方法,通常是利用大量的訓練資料,通過學習低分辨率圖像和高分辨率圖像之間的映射關系,預測低分辨圖像中丢失的高頻細節資訊,進而生成超分辨圖像。
基于淺層學習的方法主要包括機器學習、流形學習、樣本學習和稀疏編碼等,可用于資料量較小的情況。
基于深度學習的方法可以分為基于卷積神經網絡的 SR 方法、基于殘差網絡 (residual network, ResNet) 的 SR 方法和基于生成對抗網絡 (generative adversarial networks, GAN) 的 SR 方法。
基于深度學習的超分辨率重建算法網絡結構
圖源:法信網
上述三種方法的優缺點如下:
來源:HyperAI超神經
現如今,深度學習已經成為超分辨率領域的主流方法。
2014 年,研究人員首次将深度學習應用于圖像超分辨率重建領域,提出了 SRCNN (Super-Resolution Convolutional Neural Network) 網絡模型。自此,超分辨率重建領域掀起了深度學習的浪潮。
SRCNN 網絡結構
SRCNN 作為最早将深度學習方法應用于圖像超分辨率的模型,僅僅使用了 3 個卷積層,便取得了遠超傳統方法的 PSNR 值。
具體而言,輸入低分辨率圖像,用雙三次插值法 (Bicubic interpolation) 将圖像放大至目标尺寸,然後用 3 層卷積神經網絡拟合低分辨率圖像跟高分辨率圖像之間的非線性映射,最後輸出重建後的高分辨率圖像。
*PSNR 值:峰值信噪比,該數值越大,輸出的 HR 圖像品質越好。
SRCNN 憑借其簡單、高效的優勢,成為了圖像超分辨率領域的重要裡程碑。自此之後,從早期基于卷積神經網絡 (CNN) 的超分辨率技術,到近期的基于生成對抗網絡的技術,基于深度學習的超分辨率技術得到了快速發展。
深度學習+超分辨率:從公共安防到數字娛樂的多元應用
需求推動技術發展,技術疊代助力應用落地。現如今,超分辨率技術在公共安防、醫學診斷、衛星遙感和娛樂媒體等領域都得到了廣泛的應用。
* 公共安防領域
公共監控錄像受天氣和距離等因素影響,畫面常模糊且分辨率低。應用超分辨率技術可以幫助警察提取清晰的人臉、車牌号等關鍵資訊,有助于案件偵破。
研究人員利用 ESRGAN 和 BSRGAN 網絡,針對不同環境下的人像和自然景物進行了分析,探索了超分辨率技術在公安和法庭中的應用可行性。
首先,研究人員對 ESRGAN 和 BSRGAN 模型進行複現、訓練和測試,得到最佳模型參數。然後,使用訓練好的模型對采集的人像、自然景物等低品質圖像進行超分辨率重建,得到 ESRGAN 和 BSRGAN 的重建結果。
人像低品質圖像重建比對
研究人員将 ESRGAN 和 BSRGAN 的重建圖像與原始圖像進行對比。結果表明,在正面、具有傾斜角度和複雜場景中重建後的人像在視覺品質和保真度上都有很大提升。
自然場景低品質圖像重建對比
在自然場景的對比中,BSRGAN 重建效果要優于 ESRGAN,能夠有效去掉原始低品質圖像未知的複雜噪聲,可以生成清晰的邊緣和精細的細節。
* 醫學診斷領域
由于成像裝置限制和複雜的臨床環境,醫學領域所擷取的影像常常存在分辨率不足的問題,這直接影響了醫生對疾病的準确診斷與治療決策。
改進 SRGAN 的結構
研究人員以針對自然圖像超分辨率重建的生成對抗網絡 (SRGAN) 作為基本方法,通過減少 2 個輸入通道、删除 1 個殘差塊對該網絡的結構進行更改,改進網絡損失函數,新增模糊處理資料集,重建出放大 4 倍的邊緣清晰、沒有僞影的醫學超聲圖像。
Case1 重建結果感興趣區域比較
Case2 重建結果感興趣區域比較
研究人員将改進的 SRGAN 與其他 3 種算法進行比較。結果表明,改進 SRGAN 的重建結果整體平滑,紋理邊緣更清晰。
* 衛星遙感領域
近年來,遙感衛星圖像在環境監測、資源勘探、災害警報和軍事等領域得到了廣泛應用。然而,大氣變化、傳輸噪聲、運動模糊和欠采樣光學傳感器等因素嚴重制約了遙感衛星圖像的清晰度。超分辨率技術通過處理和提升低分辨率圖像,可以提高衛星遙感資料的品質和可用性。
基于局部群目标輔助的遙感圖像超分辨率重建算法流程
研究人員将遙感圖像局部聚叢集目标區域的細節特征資訊,引入到完整遙感圖像的采樣重建中,通過多層級的神經網絡提取不同尺度的圖像特征,并通過殘差學習的方式将這些特征進行融合并重建。該方法可以借助局部圖像的像素資訊,顯著提高全局遙感圖像的細節效果,優化叢集目标區域的分辨能力。
與基線方法的可視化對比
研究展示的對比圖顯示,該方法在可視化效果上顯著優于其他現有方法,适用于城市和野外場景,表現出較好的效果。
* 數字娛樂領域
動漫由多張靜止的畫面連接配接而成,其靜止圖檔分辨率将會影響最終動漫的清晰度。然而,現有的手繪或數字繪制無法保證初稿的高分辨率,這對于使用者的視覺體驗相當不友好。通過應用超分辨率技術,将這些低分辨率的畫面轉換成更高分辨率畫面,能夠呈現出更多的細節和紋理,可以使動漫作品的圖像更加生動和逼真。
B 站就曾推出了一個名為 Real-CUGAN (Real Cascaded-U-Net-style Generative Adversarial Networks) 的動漫畫質修複模型。
首先,研究人員利用該模型對動漫幀進行切塊處理,使用圖像品質打分模型對候選塊進行打分過濾,最終得到一個百萬級的高品質動漫圖像塊訓練集。
然後,通過多階段降質算法,将高清圖像塊降采樣得到低質圖像,讓模型學習、優化從低質圖像到高質圖像的重建過程。訓練完成後,模型即可對真實的二次元低質圖像進行高清化處理。
不同算法對比圖如下:
作者:十九
編輯:李寶珠,三羊
來源:HyperAI超神經
原标題:超分辨率專題 | 3 種方法、4 個教程、10 個資料集,一文 Get 核心知識點
編輯:花卷