轉自https://blog.csdn.net/hitwengqi/article/details/8292675
花了點時間整理了一下數字圖像處理知識體系,從宏觀上把握圖像處理,使自己的學習思路就更加清晰。
1.本文大部分内容來自:http://blog.csdn.net/byxdaz/article/details/4375228
2.有些内容待添加,特别是opencv相關的算法實作。
目錄
一、數字圖像基礎… 3
二、數字圖像存儲與顯示… 3
三、圖像變換… 4
1.卷積… 4
2.梯度和Sobel導數… 5
3.拉普拉斯變換… 5
4.Canny算子… 5
5.霍夫變換… 5
6.重映射… 5
7.幾何操作:拉伸、收縮、扭曲和旋轉… 5
8.離散傅裡葉變換(DFT)… 5
9.離散餘弦變換(DCT)… 5
四、形态學圖像處理… 5
1.平滑處理… 5
2.膨脹與腐蝕… 5
3.開操作與閉操作… 5
4.漫水填充算法… 5
5.尺寸調整… 5
6.圖像金字塔… 6
7.門檻值化… 6
五、圖像邊緣檢測… 6
六、圖像增強和複原… 8
1.圖像增強… 8
(1)空間域增強處理… 8
(2)頻率域增強處理… 9
2.圖像複原… 11
七、圖像壓縮… 11
八、圖像分割… 12
九、圖像特征提取與比對… 13
十、圖像分類(識别)… 15
數字圖像處理[wq1] 是對圖像進行分析、加工、和處理,使其滿足視覺、心理以及其他要求的技術。圖像處理是信号處理在圖像域上的一個應用。目前大多數的圖像是以數字形式存儲,因而圖像處理很多情況下指數字圖像處理。此外,基于光學理論的處理方法依然占有重要的地位。 數字圖像處理是信号處理的子類, 另外與計算機科學、人工智能等領域也有密切的關系。 傳統的一維信号處理的方法和概念很多仍然可以直接應用在圖像處理上,比如降噪、量化等。然而,圖像屬于二維信号,和一維信号相比,它有自己特殊的一面,處理的方式和角度也有所不同。大多數用于一維信号處理的概念都有其在二維圖像信号領域的延伸,它們中的一部分在二維情形下變得十分複雜。同時圖像處理也具有自身一些新的概念,例如,連通性、旋轉不變性,等等。這些概念僅對二維或更高維的情況下才有非平凡的意義。圖像進行中常用到快速傅立葉變換,因為它可以減小資料處理量和處理時間。
數字圖像處理應用在以下方面 :
攝影及印刷 (Photography and printing)
衛星圖像處理 (Satellite imageprocessing)
醫學圖像處理 (Medical image processing)
面孔識别, 特征識别 (Face detection,feature detection, face identification)
顯微圖像處理 (Microscope imageprocessing)
汽車障礙識别 (Car barrier detection)
一、數字圖像基礎
圖像的基本概念、圖像取樣和量化、數字圖像表示、空間和灰階級分辨率、圖像紋理、像素間的一些基本關系(相鄰像素、鄰接性、連通性、區域和邊界、距離度量)[wq2] 、線性和非線性變換操作。[wq3]
常用色彩空間分類:
二、數字圖像存儲與顯示
在計算機中,有兩種類型的圖:矢量圖(vector graphics)和位映象圖(bitmappedgraphics)。矢量圖是用數學方法描述的一系列點、線、弧和其他幾何形狀,如圖(a)所示。是以存放這種圖使用的格式稱為矢量圖格式,存儲的資料主要是繪制圖形的數學描述;位映象圖(bitmappedgraphics)也稱光栅圖(raster graphics),這種圖就像電視圖像一樣,由象點組成的,如圖(b),是以存放這種圖使用的格式稱為位映象圖格式,經常簡稱為位圖格式,存儲的資料是描述像素的數值。
圖像格式目前包括bmp格式、gif格式、jpeg格式、jpeg2000格式、tiff格式、psd格式、Png格式、swf格式、svg格式、pcx格式、dxf格式、wmf格式、emf格式、LIC格式、eps格式、TGA格式等。
目前比較出名的圖像處理庫有很多,比如LEADTOOLS、OPENCV,LEADTOOLS這個是功能非常強大的圖像多媒體庫,但是這個是收費注冊的。OpenCV 是一個跨平台的中、高層 API 構成,目前包括 300 多個 C 函數。它不依賴與其它的外部庫,盡管也可以使用某些外部庫。OpenCV 對非商業用途和商業用途都是免費(FREE)的。開源的圖像庫也有不少,比如:ImageStone、GIMP、CxImage等,雖然它們的功能沒有LEADTOOLS強大[wq4] ,但是一般的圖像處理是可以應付的。
三、圖像變換
由于圖像陣列很大,直接在空間域[wq5] 中進行處理,涉及計算量很大。是以,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散餘弦變換等間接處理技術,将空間域的處理轉換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進行數字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像進行中也有着廣泛而有效的應用。
圖像變換,也認為是将一副圖像轉變成圖像資料。
1. 卷積
- 梯度和Sobel導數[wq6]
- 拉普拉斯變換[wq7]
- Canny算子
- 霍夫變換
- 重映射
- 幾何操作:拉伸、收縮、扭曲和旋轉[wq8]
- 離散傅裡葉變換(DFT)
- 離散餘弦變換(DCT)
四、形态學圖像處理
1. 平滑處理
- 膨脹與腐蝕
- 開操作與閉操作
- 漫水填充算法
- 尺寸調整
- 圖像金字塔
- 門檻值化
五、圖像邊緣檢測
數字圖像的邊緣檢測是圖像分割、目标區域的識别、區域形狀提取等圖像分析領域十分重要的基礎,圖像了解和分析的第一步往往就是邊緣檢測,目前它以成為機器視覺研究領域最活躍的課題之一,在工程應用中占有十分重要的地位。所謂邊緣就是指圖像局部亮度變化最顯著的部分,它是檢測圖像局部變化顯著變化的最基本的運算。邊緣的記錄有鍊碼表和線段表2種,鍊碼表适合計算周長,線段表容易計算面積以及相關的,他們之間可以互相的轉換。
迄今為止,已經出現了許多成熟的算法。例如微分算法,掩模算法等。在微分算法中,常使用N*N的像素塊,例如3*3或者4*4。3*3的像素塊如下,
f(i-1,j-1) f(i-1,j) f(i-1,j+1)
f(i,j-1) f(i,j) f(i,j+1)
f(i+1,j-1) f(i+1,j) f(i+1,j+1)
我們不妨設f(i,j)為待處理的像素,而g(i, j)為處理後的像素。
常見的邊緣檢測算法:
A. Roberts邊緣算子
g(i, j) = sqrt( (f(i, j) - f(i + 1, j))^2 + (f(i + 1, j) - f(i, j +1))^2 )
或者
g(i, j) = |f(i,j) - f(i + 1,j)| + |f(i+1,j) - f(i,j+1)|
B. Sobel邊緣算子
對數字圖像的每一個像素f(i,j),考察它的上、下、左、右鄰域灰階的權重值,把各方向上(0度、45度、90度、135度)的灰階值權重之和作為輸出,可以達到提取圖像邊緣的效果。
即 g(i,j) = fxr + fyr, 其中
fxr = f(i-1,j-1)+2*f(i-1,j)+f(i-1,j+1)-f(i+1,j-1)-2*f(i+1,j)-f(i+1,j+1)
fyr = f(i-1,j-1)+2*f(i,j-1)+f(i+1,j-1)-f(i-1,j+1)-2*f(i,j+1)-f(i+1,j+1)
C. Laplace算子
Laplace算子是一種二階微分算子。它有兩種形式:4鄰域微分算子和8鄰域微分算子。
⊙ 4鄰域微分
g(i,j)=|4*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)|
⊙ 8鄰域微分
g(i,j)=|8*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)-f(i-1,j-1)-f(i-1,j+1)-f(i+1,j-1)-f(i+1,j+1)|
D. Prewitt邊緣算子
prewitt算子是一個邊緣模闆算子,由八個方向的樣闆組成,能夠在0度,45度,90度,135度,180度,225度角
等八個方向檢測邊緣。8個3*3邊緣模闆及方向如下:
90度角: 45度角:
1 1 1 -1 -1 -1
1 -2 1 1 -2 1
-1 -1 -1 1 1 1
0度角: 315度角:
-1 1 1 1 1 -1
-1 -2 1 1 -2 -1
-1 1 1 1 1 -1
270度角: 225度角:
1 1 1 -1 -1 1
-1 -2 1 -1 -2 1
-1 -1 1 1 1 1
180度角: 135度角:
1 1 1 1 -1 -1
1 -2 -1 1 -2 -1
1 -1 -1 1 1 1
3*3時表達式如下:
A1*f(i-1,j-1) A8*f(i,j-1) A7*f(i+1,j-1)
A2*f(i-1,j) -2*f(i,j) A6*f(i+1, j)
A3*f(i-1,j+1) A4*f(i,j+1) A5*f(i+1,j+1)
g(i,j)=|-2*f(i,j)+A8*f(i,j-1)+A1*f(i-1,j-1)+A2*f(i-1,j)+A3*f(i-1,j+1)+A4*f(i,j+1)+A5*f(i+1,j+1)+A6*f(i+1,j)+A7*f(i+1,j-1)|
在程式設計中,依次用樣闆去檢測圖像,與被檢測區域最為相似的樣闆給出最大值,用該最大值作為算子的輸出值。
E.Kirsch邊緣算子
Kirsch算子是一個模闆算子,由八個方向的邊緣樣闆組成,能夠在0度,45度,90度,135度,180度,225度角
等八個方向檢測邊緣。8個3*3邊緣模闆及方向如下:
90度角: 45度角:
5 5 5 -3 5 5
-3 0 -3 -3 0 5
-3 -3 -3 -3 -3 -3
0度角: 315度角:
-3 -3 5 -3 -3 -3
-3 0 5 -3 0 5
-3 -3 5 -3 5 5
270度角: 225度角:
5 5 -3 -3 -3 -3
5 0 -3 5 0 -3
-3 -3 -3 5 5 -3
180度角: 135度角:
5 -3 -3 5 5 -3
5 0 -3 5 0 -3
5 -3 -3 -3 -3 3
使用方法與prewitt算子一樣。
F.CANNY邊緣檢測
六、圖像增強和複原
圖像增強和複原的目的是為了提高圖像的品質,如去除噪聲,提高圖像的清晰度等。圖像增強不考慮圖像降質的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節明顯;如強化低頻分量可減少圖像中噪聲影響。圖像複原要求對圖像降質的原因有一定的了解,一般講應根據降質過程建立“降質模型”,再采用某種濾波方法,恢複或重建原來的圖像。
1. 圖像增強
圖像增強的目的在于改善圖像的顯示品質,以利于資訊的提取和識别。從方法上說,則是設法摒棄一些認為不必要或幹擾的資訊,而将所需要的資訊得以突出出來,以利于分析判讀或作進一步的處理。
(1) 空間域增強處理
空間域是指圖像平面所在的二維空間,空間域圖像增強是指在圖像平面上應用某種數學模型,通過改變圖像像元灰階值達到增強效果,這種增強并不改變像元的位置。空域增強包括空域變換增強與空域濾波增強兩種。空域變換增強是基于點處理的增強方法、空域濾波增強是基于鄰域處理的增強方法。
1) 空域變換增強
常用的空域變換增強方法包括:對比度增強、直方圖增強和圖像算術運算等。
A.對比度增強
對比度增強是一種通過改變圖像像元的亮度分布态勢,擴充灰階分布區間來改變圖像像元對比度,進而改善圖像品質的圖像處理方法。因為亮度值是輻射強度的反映,是以也稱為輻射增強。常用的方法有對比度線性變換和非線性變換。其關鍵是尋找到一個函數,以此函數對圖像中每一個像元進行變換,使像元得到統一的重新配置設定,構成得到反差增強的圖像。
B.直方圖增強
直方圖均衡化:
直方圖均衡化基本做法是将每個灰階區間等機率分布代替了原來的随機分布,即增強後的圖象中每一灰階級的像元數目大緻相同。直方圖均衡化可使得面積最大的地物細節得以增強,而面積小的地物與其灰階接近的地物進行合并,形成綜合地物。減少灰階等級換取對比度的增大。
直方圖歸一化:
直方圖歸一化是把原圖像的直方圖變換為某種指定形态的直方圖或某一參考圖像的直方圖,然後按着已知的指定形态的直方圖調整原圖像各像元的灰級,最後得到一個直方圖比對的圖像。這種方法主要應用在有一幅很好的圖像作為标準的情況下,對另一幅不滿意的圖像用标準圖像的直方圖進行比對處理,以改善被處理圖像的品質。如在數字鑲嵌時,重疊區影像色調由于時相等原因差異往往很大,利用直方圖比對這一方法後可以改善重疊區影像色調過度,如果鑲嵌圖像時相相差不大,完全可以作到無縫鑲嵌。
C.數字圖像的算術運算
兩幅或多幅單波段影像,完成空間配準後,通過一系列運算,可以實作圖像增強,達到提取某些資訊或去掉某些不必要資訊的目的。
2) 空域濾波增強
空域變換增強是按像元逐點運算的,從整體上改善圖像的品質,并不考慮周圍像元影響。空間濾波增強則是以重點突出圖像上的某些特征為目的的(如突出邊緣或紋理等),通過像元與周圍相鄰像元的關系,采取空間域中的鄰域處理方法進行圖像增強。鄰域法處理用于去噪聲、圖像平滑、銳化和相關運算。
圖像卷積運算是在空間域上對圖像作局部檢測的運算,以實作平滑和銳化的目的。具體作法是標明一卷積函數,又稱為“M×N視窗”或“模闆”,如3×3或5×5等。然後從圖像左上角開始開一與模闆同樣大小的活動視窗,圖像視窗與模闆像元的亮度值對應相乘再相加。将計算結果賦予中心像元作為其灰階值,然後待移動後重新計算,将計算結果賦予另一個中心像元,以此類推直到全幅圖像掃描一遍結束生成新的圖像。
平滑是指圖像中出現某些亮度變化過大的區域,或出現不該有的亮點(“噪聲”)時,采用平滑方法可以減小變化,使亮度平緩或去掉不必要“噪聲”點。它實際上是使圖像中高頻成分消退,即平滑圖像的細節,降低其反差,儲存低頻成分,在頻域中稱為低通濾波。具體方法有:均值平滑、中值濾波、銳化。
銳化的作用在于提高邊緣灰階值的變化率,使界線更加清晰。它是增強圖像中的高頻成分,在頻域進行中稱為高通濾波,也就是使圖像細節的反差提高,也稱邊緣增強。要突出圖像的邊緣、線狀目标或亮度變化率大的部分常采用銳化方法。一般有三種實作方法:
A.梯度法
梯度反映了相鄰像元的亮度變化率,即圖像中如果存在邊緣,如湖泊、河流的邊界,山脈和道路等,則邊緣處有較大的梯度值。對于亮度值較平滑的部分,亮度梯度值較小。是以,找到梯度較大的位置,也就找到邊緣,然後再用不同的梯度計算值代替邊緣處像元的值,也就突出了邊緣,實作了圖像的銳化。通常有羅伯特梯度和索伯爾梯度方法。
B.拉普拉斯算法
拉普拉斯算法的意義與梯度法不同,它不檢測均勻的亮度變化,而是檢測變化率的變化率,相當于二階微分。計算出的圖像更加突出亮度值突變的位置。
C.定向檢測
當有目的地檢測某一方向的邊、線或紋理特征時,可選擇特定的模闆卷積運算作定向檢測。可以檢測垂直邊界、水準邊界和對角線邊界等,各使用的模闆不同。
(2) 頻率域增強處理
頻域增強指在圖像的頻率域内,對圖像的變換系數(頻率成分)直接進行運算,然後通過Fourier逆變換以獲得圖像的增強效果。一般來說,圖像的邊緣和噪聲對應Fourier變換中的高頻部分,是以低通濾波能夠平滑圖像、去除噪聲。圖像灰階發生聚變的部分與頻譜的高頻分量對應,是以采用高頻濾波器衰減或抑制低頻分量,能夠對圖像進行銳化處理。頻域,就是由圖像f(x,y)的二維傅立葉變換和相應的頻率變量(u,v)的值所組成的空間。在空間域圖像強度的變化模式(或規律)可以直接在該空間得到反應。F(0,0)是頻域中的原點,反應圖像的平均灰階級,即圖像中的直流成分;低頻反映圖像灰階發生緩慢變化的部分;而高頻對應圖像中灰階發生更快速變化的部分,如邊緣、噪聲等。但頻域不能反應圖像的空間資訊。
空域和頻域濾波間的對應關系,卷積定理是空域和頻域濾波的最基本聯系紐帶。二維卷積定理:
基本計算過程:
取函數h(m,n)關于原點的鏡像,得到h(-m,-n)
對某個(x,y),使h(-m,-n)移動相應的距離,得到h(x-m,y-n)
對積函數f(m,n)h(x-m,y-n)在(m,n)的取值範圍内求和
位移是整數增量,對所有的(x,y)重複上面的過程,直到兩個函數:f(m,n)和h(x-m,y-n)不再有重疊的部分。
傅立葉變換是空域和頻域的橋梁,關于兩個域濾波的傅立葉變換對:
頻域與空域濾波的比較:
1. 對具有同樣大小的空域和頻率濾波器:h(x,y), H(u,v),頻域計算(由于FFT)往往更有效(尤其是圖像尺寸比較大時)。但對在空域中用尺寸較小的模闆就能解決的問題,則往往在空域中直接操作。
2. 頻域濾波雖然更直接,但如果可以使用較小的濾波器,還是在空域計算為好。 因為省去了計算傅立葉變換及反變換等步驟。
3. 由于更多的直覺性,頻率濾波器設計往往作為空域濾波器設計的向導。
平滑的頻率域濾波器類型:
1 、理想低通濾波器
2 、巴特沃思低通濾波器
3 、高斯低通濾波器
頻率域銳化濾波器類型:
1 理想高通濾波器
2 巴特沃思高通濾波器
3 高斯型高通濾波器
4 頻率域的拉普拉斯算子
5 鈍化模闆、高頻提升濾波和高頻加強濾波
頻率域圖像增強處理的過程:
-
圖像複原
試圖利用退化過程的先驗知識,去恢複已被退化圖像的本來面目。圖像複原[wq9] 的基本思路:先建立退化的數學模型,然後根據該模型對退化圖像進行拟合。
圖像複原模型可以用連續數學和離散數學處理,處理項的實作可在空間域卷積,或在頻域相乘。
七、圖像壓縮
圖像壓縮是資料壓縮技術在數字圖像上的應用,它的目的是減少圖像資料中的備援資訊進而用更加高效的格式存儲和傳輸資料。圖像壓縮可以是有損資料壓縮也可以是無損資料壓縮。對于如繪制的技術圖、圖表或者漫畫優先使用無損壓縮,這是因為有損壓縮方法,尤其是在低的位速條件下将會帶來壓縮失真。如醫療圖像或者用于存檔的掃描圖像等這些有價值的内容的壓縮也盡量選擇無損壓縮方法。有損方法非常适合于自然的圖像,例如一些應用中圖像的微小損失是可以接受的(有時是無法感覺的),這樣就可以大幅度地減小位速。編碼是壓縮技術中最重要的方法,它在圖像處理技術中是發展最早且比較成熟的技術。
-
無損圖像壓縮方法
A.行程長度編碼
B.熵編碼法
C.LZW算法
-
有損壓縮方法
A.将色彩空間化減到圖像中常用的顔色。所選擇的顔色定義在壓縮圖像頭的調色闆中,圖像中的每個像素都用調色闆中顔色索引表示。這種方法可以與 抖動(en:dithering)一起使用以模糊顔色邊界。
B.色度抽樣,這利用了人眼對于亮度變化的敏感性遠大于顔色變化,這樣就可以将圖像中的顔色資訊減少一半甚至更多。
C.變換編碼,這是最常用的方法。首先使用如離散餘弦變換(DCT)或者小波變換這樣的傅立葉相關變換,然後進行量化和用熵編碼法壓縮。
D.分形壓縮(en:Fractal compression)。
八、圖像分割
圖像分割是數字圖像進行中的關鍵技術之一。圖像分割是将圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區域等,這是進一步進行圖像識别、分析和了解的基礎。雖然目前已研究出不少邊緣提取、區域分割的方法,但還沒有一種普遍适用于各種圖像的有效方法。是以,對圖像分割的研究還在不斷深入之中,是目前圖像進行中研究的熱點之一。
通常圖像分割的實作方法是,将圖像分為“黑”、“白”兩類,這兩類分别代表了兩個不同的對象。
圖像分割方法:門檻值分割、區域分割、數學形态學、模式識别方法
A.門檻值分割包括以下幾種:
(1)由直方圖灰階分布選擇門檻值
(2)雙峰法選擇門檻值
(3)疊代法選取門檻值
原理如下,很好了解。
疊代法是基于逼近的思想,其步驟如下:
1.求出圖像的最大灰階值和最小灰階值,分别記為ZMAX和ZMIN,令初始門檻值T0=(ZMAX+ZMIN)/2;
2.根據門檻值TK将圖象分割為前景和背景,分别求出兩者的平均灰階值ZO和ZB;
3.求出新門檻值TK+1=(ZO+ZB)/2;
4.若TK=TK+1,則所得即為門檻值;否則轉2,疊代計算。
(4)大津法選擇門檻值[wq10]
大津法是屬于最大類間方差法,它是自适應計算單門檻值的簡單高效方法,或者叫(Otsu)。大津法由大津于1979年提出,對圖像Image,記t為前景與背景的分割門檻值,前景點數占圖像比例為w0,平均灰階為u0;背景點數占圖像比例為w1,平均灰階為u1。圖像的總平均灰階為:u=w0*u0+w1*u1。從最小灰階值到最大灰階值周遊t,當t使得值g=w0*(u0-u)2+w1*(u1-u)2最大時t即為分割的最佳門檻值。對大津法可作如下了解:該式實際上就是類間方內插補點,門檻值t分割出的前景和背景兩部分構成了整幅圖像,而前景取值u0,機率為 w0,背景取值u1,機率為w1,總均值為u,根據方差的定義即得該式。因方差是灰階分布均勻性的一種度量,方內插補點越大,說明構成圖像的兩部分差别越大, 當部分目标錯分為背景或部分背景錯分為目标都會導緻兩部分差别變小,是以使類間方差最大的分割意味着錯分機率最小。直接應用大津法計算量較大,是以一般采用了等價的公式g=w0*w1*(u0-u1)2。
(5)由灰階拉伸選擇門檻值
大津法是較通用的方法,但是它對兩群物體在灰階不明顯的情況下會丢失一些整體資訊。是以為了解決這種現象采用灰階拉伸的增強大津法。在大津法的思想上增加灰階的級數來增強前兩群物體的灰階差。對于原來的灰階級乘上同一個系數,進而擴大了圖像灰階的級數。試驗結果表明不同的拉伸系數,分割效果差别比較大。
B.區域的分割
區域生長、區域分離與合并
區域生長算法
C.基于形态學分水嶺的分割
分水嶺分割算法
九、圖像特征提取與比對[wq11]
常用的圖像特征有顔色特征、紋理特征、形狀特征、空間關系特征。
A.顔色特征
特點:顔色特征是一種全局特征,描述了圖像或圖像區域所對應的景物的表面性質。一般顔色特征是基于像素點的特征,此時所有屬于圖像或圖像區域的像素都有各自的貢獻。由于顔色對圖像或圖像區域的方向、大小等變化不敏感,是以顔色特征不能很好地捕捉圖像中對象的局部特征。
常用的特征提取與比對方法:
顔色直方圖
其優點在于:它能簡單描述一幅圖像中顔色的全局分布,即不同色彩在整幅圖像中所占的比例,特别适用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。其缺點在于:它無法描述圖像中顔色的局部分布及每種色彩所處的空間位置,即無法描述圖像中的某一具體的對象或物體。
顔色直方圖特征比對方法:直方圖相交法、距離法、中心距法、參考顔色表法、累加顔色直方圖法。
B.紋理特征
紋理特征的提取方法比較簡單,它是用一個活動的視窗在圖像上連續滑動,分别計算出視窗中的方差、均值、最大值、最小值及二者之差和資訊熵等,形成相應的紋理圖像,當目标的光譜特性比較接近時,紋理特征對于區分目标可以起到積極的作用。選取适當的資料動态變化範圍,進行紋理特征提取後,使影像的紋理特征得到突出,有利于提取構造資訊。
特點:紋理特征也是一種全局特征,它也描述了圖像或圖像區域所對應景物的表面性質。但由于紋理隻是一種物體表面的特性,并不能完全反映出物體的本質屬性,是以僅僅利用紋理特征是無法獲得高層次圖像内容的。與顔色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區域中進行統計計算。在模式比對中,這種區域性的特征具有較大的優越性,不會由于局部的偏差而無法比對成功。作為一種統計特征,紋理特征常具有旋轉不變性,并且對于噪聲有較強的抵抗能力。但是,紋理特征也有其缺點,一個很明顯的缺點是當圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來的紋理不一定是3-D物體表面真實的紋理。
常用的特征提取與比對方法:
紋理特征描述方法分類
(1)統計方法統計方法的典型代表是一種稱為灰階共生矩陣的紋理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩陣中各種統計特征基礎上,通過實驗,得出灰階共生矩陣的四個關鍵特征:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從圖像的自相關函數(即圖像的能量譜函數)提取紋理特征,即通過對圖像的能量譜函數的計算,提取紋理的粗細度及方向性等特征參數
(2)幾何法
所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特征分析方法。紋理基元理論認為,複雜的紋理可以由若幹簡單的紋理基元以一定的有規律的形式重複排列構成。在幾何法中,比較有影響的算法有兩種:Voronio 棋盤格特征法和結構法。
(3)模型法
模型法以圖像的構造模型為基礎,采用模型的參數作為紋理特征。典型的方法是随機場模型法,如馬爾可夫(Markov)随機場(MRF)模型法和 Gibbs 随機場模型法
(4)信号處理法
紋理特征的提取與比對主要有:灰階共生矩陣、Tamura 紋理特征、自回歸紋理模型、小波變換等。灰階共生矩陣特征提取與比對主要依賴于能量、慣量、熵和相關性四個參數。Tamura 紋理特征基于人類對紋理的視覺感覺心理學研究,提出6種屬性,即:粗糙度、對比度、方向度、線像度、規整度和粗略度。自回歸紋理模型(simultaneousauto-regressive, SAR)是馬爾可夫随機場(MRF)模型的一種應用執行個體。
C.形狀特征
特點:各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目标來進行檢索,但它們也有一些共同的問題。
常用的特征提取與比對方法:
通常情況下,形狀特征有兩類表示方法,一類是輪廓特征,另一類是區域特征。圖像的輪廓特征主要針對物體的外邊界,而圖像的區域特征則關系到整個形狀區域。
幾種典型的形狀特征描述方法:
(1) 邊界特征法
該方法通過對邊界特征的描述來擷取圖像的形狀參數。其中Hough 變換檢測平行直線方法和邊界方向直方圖方法是經典方法。Hough 變換是利用圖像全局特性而将邊緣像素連接配接起來組成區域封閉邊界的一種方法,其基本思想是點—線的對偶性;邊界方向直方圖法首先微分圖像求得圖像邊緣,然後,做出關于邊緣大小和方向的直方圖,通常的方法是構造圖像灰階梯度方向矩陣。
(2)傅裡葉形狀描述符法
傅裡葉形狀描述符(Fourier shapedescriptors)基本思想是用物體邊界的傅裡葉變換作為形狀描述,利用區域邊界的封閉性和周期性,将二維問題轉化為一維問題。由邊界點導出三種形狀表達,分别是曲率函數、質心距離、複坐标函數。
(3)幾何參數法
形狀的表達和比對采用更為簡單的區域特征描述方法,例如采用有關形狀定量測度(如矩、面積、周長等)的形狀參數法(shape factor)。在 QBIC 系統中,便是利用圓度、偏心率、主軸方向和代數不變矩等幾何參數,進行基于形狀特征的圖像檢索。
D.空間關系特征
特點:所謂空間關系,是指圖像中分割出來的多個目标之間的互相的空間位置或相對方向關系,這些關系也可分為連接配接/鄰接關系、交疊/重疊關系和包含/包容關系等。通常空間位置資訊可以分為兩類:相對空間位置資訊和絕對空間位置資訊。前一種關系強調的是目标之間的相對情況,如上下左右關系等,後一種關系強調的是目标之間的距離大小以及方位。顯而易見,由絕對空間位置可推出相對空間位置,但表達相對空間位置資訊常比較簡單。
空間關系特征的使用可加強對圖像内容的描述區分能力,但空間關系特征常對圖像或目标的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間資訊往往是不夠的,不能有效準确地表達場景資訊。為了檢索,除使用空間關系特征外,還需要其它特征來配合。
常用的特征提取與比對方法:
提取圖像空間關系特征可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顔色區域,然後根據這些區域提取圖像特征,并建立索引;另一種方法則簡單地将圖像均勻地劃分為若幹規則子塊,然後對每個圖像子塊提取特征,并建立索引。
十、圖像分類(識别)
圖像分類(識别)屬于模式識别的範疇,其主要内容是圖像經過某些預處理(增強、複原、壓縮)後,進行圖像分割和特征提取,進而進行判決分類。圖像分類常采用經典的模式識别方法,有統計模式分類和句法(結構)模式分類,近年來新發展起來的模糊模式識别和人工神經網絡模式分類在圖像識别中也越來越受到重視。
模式識别是一種從大量資訊和資料出發,在專家經驗和已有認識的基礎上,利用計算機和數學推理的方法對形狀、模式、曲線、數字、字元格式和圖形自動完成識别的過程。模式識别包括互相關聯的兩個階段,即學習階段和實作階段,前者是對樣本進行特征選擇,尋找分類的規律,後者是根據分類規律對未知樣本集進行分類和識别。廣義的模式識别屬計算機科學中智能模拟的研究範疇,内容非常廣泛,包括聲音和語言識别、文字識别、指紋識别、聲納信号和地震信号分析、照片圖檔分析、化學模式識别等等。計算機模式識别實作了部分腦力勞動自動化。
模式識别--對表征事物或現象的各種形式的(數值的,文字的和邏輯關系的)資訊進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是資訊科學和人工智能的重要組成部分。
模式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等,屬于概念識别研究的範疇,是人工智能的另一研究分支。我們所指的模式識别主要是對語音波形、地震波、心電圖、腦電圖、圖檔、文字、符号、三位物體和景物以及各種可以用實體的、化學的、生物的傳感器對對象進行測量的具體模式進行分類和辨識。
模式識别問題指的是對一系列過程或事件的分類與描述,具有某些相類似的性質的過程或事件就分為一類。模式識别問題一般可以應用以下4種方法進行分析處理。
模版比對:
統計模式識别方法:統計模式識别方法是受數學中的決策理論的啟發而産生的一種識别方法,它一般假定被識别的對象或經過特征提取向量是符合一定分布規律的随機變量。其基本思想是将特征提取階段得到的特征向量定義在一個特征空間中,這個空間包含了所有的特征向量,不同的特征向量,或者說不同類别的對象都對應于空間中的一點。在分類階段,則利用統計決策的原理對特征空間進行劃分,進而達到識别不同特征的對象的目的。統計模式識别中個應用的統計決策分類理論相對比較成熟,研究的重點是特征提取。統計模式識别的基本原理是:有相似性的樣本在模式空間中互相接近,并形成“集團”,即“物以類聚”。其分析方法是根據模式所測得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N),将一個給定的模式歸入C個類ω1,ω2,…,ωc中,然後根據模式之間的距離函數來判别分類。其中,T表示轉置;N為樣本點數;d為樣本特征數。
統計模式識别的主要方法有:判别函數法,k近鄰分類法,非線性映射法,特征分析法,主因子分析法等。
在統計模式識别中,貝葉斯決策規則從理論上解決了最優分類器的設計問題,但其實施卻必須首先解決更困難的機率密度估計問題。BP神經網絡直接從觀測資料(訓練樣本)學習,是更簡便有效的方法,因而獲得了廣泛的應用,但它是一種啟發式技術,缺乏指定工程實踐的堅實理論基礎。統計推斷理論研究所取得的突破性成果導緻現代統計學習理論——VC理論的建立,該理論不僅在嚴格的數學基礎上圓滿地回答了人工神經網絡中出現的理論問題,而且導出了一種新的學習方法——支撐向量機。
人工神經網絡模式識别:人工神經網絡的研究起源于對生物神經系統的研究。人工神經網絡差別于其他識别方法的最大特點是它對待識别的對象不要求有太多的分析與了解,具有一定的智能化處理的特點。
句法結構模式識别:又稱結構方法或語言學方法。其基本思想是把一個模式描述為較簡單的子模式的組合,子模式又可描述為更簡單的子模式的組合,最終得到一個樹形的結構描述,在底層的最簡單的子模式稱為模式基元。在句法方法中選取基元的問題相當于在決策理論方法中選取特征的問題。通常要求所選的基元能對模式提供一個緊湊的反映其結構關系的描述,又要易于用非句法方法加以抽取。顯然,基元本身不應該含有重要的結構資訊。模式以一組基元和它們的組合關系來描述,稱為模式描述語句,這相當于在語言中,句子和短語用詞組合,詞用字元組合一樣。基元組合成模式的規則,由所謂文法來指定。一旦基元被鑒别,識别過程可通過句法分析進行,即分析給定的模式語句是否符合指定的文法,滿足某類文法的即被分入該類。
在幾種算法中,統計模式識别是最經典的分類識别方法,在圖像模式識别中有着非常廣泛的應用。
[wq1]
本文參考《數字圖像處理》(第二版)
作者:岡薩雷斯
[wq2]
參考第二章,掌握概念?
[wq3]
線性變換:如果變換函數是線性的或是分段線性,這種變換就是線性變換。以線性函數加大圖像的對比度的效果是使整幅圖像的品質改善。以分段線性函數加大圖像中某個(或某幾個)亮度區間的對比度的效果是使局部亮度區間的品質得到改善。
非線性變換:當變換函數是非線性時,即為非線性變換。常用的有指數變換和對數變換。
[wq4]
參考《幾種圖像處理庫的研究》:http://blog.csdn.net/byxdaz/article/details/3972293
[wq5]
以時間作為變量所進行的研究就是時域
以頻率作為變量所進行的研究就是頻域
以空間坐标作為變量進行的研究就是空間域
以波數作為變量所進行的研究稱為波數域
[wq6]
一階微分
[wq7]
二次導數,其離散實作類似于二階Sobel導數
[wq8]
1) 仿射變換
2) 透視變換
[wq9]
參考
http://download.csdn.net/source/1513324
[wq10]
OTSU
[wq11]
SIFT特征怎麼用?