[1] Autonomous Structural Visual Inspection Using Region-Based Deep Learning for Detecting Multiple Damage Types
2018年的一篇雜志文章。文章使用Faster R-CNN用于土木建築領域的混凝土。鋼裂紋等損傷檢測,文章主要是把Faster R-CNN遷移到行業檢測,算是Faster R-CNN模型的實戰,想要快速發論文的同學,可以參考一下寫作模式。

檢測對象
[2] Anomaly Detection in Nanofibrous Materials by CNN-Based Self-Similarity
2018年的一篇雜志文章。本文提出了一種無監督的納米纖維材料掃描電鏡圖像(SEM)異常檢測方法。簡單說一下作者的想法:1.建立正常樣本子patch字典
将無缺陷的樣本通過一定尺寸的patch采樣,輸入特征提取器(論文使用的是帶預訓練權重的ResNet-18),将提取的特征向量使用PCA降維到低次元特征。由于所提出的方法是基于區域(patch)的,缺陷定位的精度取決于patch的采樣大小和采樣區域之間的空間重疊。
字典建立過程
字典數量和patch尺寸
2.異常檢測
對于測試圖像,通過相同尺寸的patch采樣,輸入相同的特征提取器,用歐式距離度量每一個patch圖像的特征向量和字典特征向量的距離,然後再計算一個門檻值,如果大于門檻值,則為異常區域。關于具體的門檻值的計算,和作者郵件交流了下,他們是将與測試子patch特征向量最近的五個正常樣本字典的歐式距離的均值。示意圖如下:
異常衡量
3.檢測的對象
4.ResNet-18網絡結構
子區域圖像特征提取網絡使用的是ResNet-18,網絡是在ILSVRC 2015識别挑戰賽的圖像集上預訓練的權重遷移到本文的檢測網絡上。作者對比了基于自然場景圖像和缺陷檢測圖像預訓練下的權重對檢測效果的影響,發現自然場景效果更好,是以,自然場景圖檔的内容複雜使得網絡學習後特征表達能力更強。
5.個人想法
文章讓人思考的地方很多,下面分條闡述:
1、我們都知道CNN一般是要訓練的(監督),但是此文僅使用遷移過來的CNN用于特征提取,也就是說,作者想得到“尺寸較小”但是對圖像特征表示能力又好的特征向量。我們如果使用卷積自編碼器對正常樣本做重建,使用中間尺寸較小的feature 做提取的特征,是否可以達到同樣效果等等。
2、字典的建立,論文中使用CNN+PCA的組合,也有使用稀疏編碼做字典建立的《稀疏編碼用于産品表面異常檢測》。