天天看點

數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹

數字圖像處理(岡薩雷斯)——第二章數字圖像基礎

  • 2.1 視覺感覺要素
    • 2.1.1 人眼的結構
    • 2.1.2 亮度适應和辨識
  • 2.2 光和電磁波譜
  • 2.3 圖像感覺和擷取
    • 2.3.1 簡單的圖像形成模型
  • 2.4 圖像取樣和量化
    • 2.4.1 取樣和量化
    • 2.4.2 數字圖像的表示
    • 2.4.3 空間和灰階分辨率
  • 2.4.4 圖像内插(image interpolation)
  • 2.5 像素間的一些基本關系
    • 2.5.1 相鄰像素
    • 2.5.2 鄰接性、連通性、區域和邊界
    • 2.5.3 距離度量
  • 2.6 數字圖像處理所用數學工具介紹
    • 2.6.1 陣列與矩陣操作
    • 2.6.2 線性操作與非線性操作
    • 2.6.3 算術操作
    • 2.6.4 集合和邏輯操作
    • 2.6.5 空間操作
    • 2.6.6 向量與矩陣操作
    • 2.6.7 圖象變換
    • 2.6.8 機率方法

2.1 視覺感覺要素

  • 雖然數字圖像處理這一領域建立在數學和機率公式表示的基礎上,但人的直覺和分析在選擇一種技術而不選擇另一種技術時會起核心作用,這種選擇通常是基于主觀的視覺判斷做出的。

2.1.1 人眼的結構

人眼分辨細節的能力與目前電子傳感器是可以類比的

眼睛由三層膜包裹:角膜與鞏膜外殼、脈絡膜和視網膜。

  • 視網膜

    視網膜是眼睛最裡面的膜,它布滿了整個後部的内壁,當眼睛适當聚焦時,來自眼睛外部物體的光在視網膜上成像。感受器通過感受視網膜表面分布的不連續光形成圖案。光感受器分為:錐狀體和杆狀體。

    • 錐狀體

      每隻眼睛中的錐狀體數量約為600~700萬個,主要位于視網膜中成為中間凹的中間部分,對顔色高度敏感。使用錐狀體人可以充分分辨圖像細節,因為每個錐狀體都連接配接到自身的神經末梢,肌肉通過控制眼球運動使得感興趣物體圖像落到中央凹上。錐狀體視覺稱為白晝視覺或亮視覺。

    • 杆狀體

      約有7500~15000萬個杆狀體分布在視網膜表面,由于分布面積較大而且幾個杆狀體連接配接到一個神經末梢,故減少了感受器感受細節的數量,用來給出視野内的總體圖像。沒有色彩感覺,對低照明度敏感。杆狀體視覺稱為暗視覺或微光視覺。

2.1.2 亮度适應和辨識

  • 人的視覺系統能夠适應的光強度級别範圍很寬—從暗門檻值到強閃光約有1010個量級。實驗資料指出,主觀亮度(感覺亮度,即由人的視覺系統感覺的亮度)是進入人眼的光強的對數函數。
  • 馬赫帶效應表明感覺亮度不是強度的簡單函數。

2.2 光和電磁波譜

數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹

λ = c / v E = h v \begin{array}{c} \lambda=c / v \\ E=h v \end{array} λ=c/vE=hv​

其中, c c c是光速 2.998 × 1 0 8 m / s 2.998×10^8m/s 2.998×108m/s、 h h h是普朗克常數。

  • 電磁波的能量與頻率成正比
  • 可見光波段的跨越範圍: 0.43 μ m 0.43μm 0.43μm(紫色)~ 0.79 μ m 0.79μm 0.79μm(紅色)。
  • 彩色譜主要分為6個主要區域:紫色、藍色、綠色、黃色、橘黃色和紅色。
  • 人感受到的物體顔色由物體反射光的性質決定。若一個物體相對平衡地反射所有可見光,觀察者看到的物體是白色的。若一個物體在可見光譜的有限範圍内反射時,會呈現各種顔色色調。例如,綠色物體反射波長範圍為: 500 n m 500nm 500nm~ 570 n m 570nm 570nm的光,而吸收其他波長的大部分能量。
  • 沒有顔色的光稱為單色光或無色光,其唯一屬性是強度或大小。
  • 灰階級:表示單色光的強度。
  • 除頻率外,還用3個基本量來描述彩色光源的品質:發光強度、光通量和亮度。發光強度是從光源發出的能量總量,通常用瓦特(W)來度量。光通量給出了觀察者從光源感受到的能量,通常用流明數(lm)來度量。亮度是光感覺的主觀描繪子,它實際上不能度量。它是描述彩色感覺的參數之一,具體展現了強度的無色概念。

2.3 圖像感覺和擷取

  • 使用單個傳感器擷取圖像
  • 使用條帶傳感器擷取圖像
  • 使用傳感器陣列擷取圖像

2.3.1 簡單的圖像形成模型

  • f ( x , y ) = i ( x , y ) r ( x , y ) f(x, y)=i(x, y) r(x, y) f(x,y)=i(x,y)r(x,y)

    其中 0 < i ( x , y ) < ∞ , 0 ( 全 吸 收 ) < r ( x , y ) < 1 ( 全 反 射 ) 0<i(x,y)<∞,0(全吸收)<r(x,y)<1(全反射) 0<i(x,y)<∞,0(全吸收)<r(x,y)<1(全反射)

    i ( x , y ) i(x,y) i(x,y):入射分量。入射到被觀察場景的光源照射總量.

    r ( x , y ) r(x,y) r(x,y):反射分量。場景中物體所反射的光照總量.

  • 當一幅圖像由實體過程産生時,其亮度值正比于實體源(如電磁波)輻射的能量。
  • 令單色圖像的任何坐标 ( x 0 , y 0 ) (x_{0},y_{0}) (x0​,y0​)處的強度表示為 ℓ = f ( x 0 , y 0 ) \ell=f\left(x_{0}, y_{0}\right) ℓ=f(x0​,y0​)

    其中 ℓ \ell ℓ的取值範圍為 [ L m i n , L m a x ] [Lmin,Lmax] [Lmin,Lmax]

    區間 [ L m i n , L m a x ] [Lmin,Lmax] [Lmin,Lmax]為灰階級。實際情況下常令該區間為 [ 0 , L − 1 ] [0,L-1] [0,L−1],其中 ℓ = 0 \ell = 0 ℓ=0為黑色, ℓ = L − 1 \ell = L-1 ℓ=L−1為白色。

    灰階級一般為 2 2 2的整數次幂,且 L = 2 k L = 2^k L=2k

2.4 圖像取樣和量化

2.4.1 取樣和量化

  • 取樣(sampling): digitization of continuous spatial coordinates (x, y) –坐标值數字化
  • 量化(quantization): Digitizing the amplitude values –幅度值數字化
  • 數字圖像的品質在很大程度上取決于取樣和量化中所用的樣本數(對應于取樣)和灰階級(對應于量化)。

2.4.2 數字圖像的表示

  • 灰階級(Gray levels)、動态範圍、對比度:

    出于儲存和量化硬體的考慮,灰階級數 L L L通常取為2的整數次幂,即

    L = 2 k ⇒ L=2^{k} \Rightarrow L=2k⇒ Dynamic range = [ 0 , L − 1 ] =[0, L-1] =[0,L−1]

    灰階跨越的值域非正式的稱為動态範圍Dynamic range在這裡定義為系統中最大可度量灰階與最小可檢測灰階之比,其上限取決于飽和度,下限取決于噪聲。與這一概念緊密聯系的是圖像的對比度,即一幅圖像中最高和最低灰階級間的灰階差。

  • 存儲數字圖像所需的比特數為

    b = M × N × k b=M\times{N}\times{k} b=M×N×k

    當一幅圖像有 2 k 2k 2k個灰階級時,實際上通常稱該圖像為一幅“ k k k比特圖像”。例如,有256個可能的離散灰階值的圖像,稱為8比特圖像。

2.4.3 空間和灰階分辨率

  • 圖像分辨率(image resolution)-- 數字圖像解析場景元素的能力(capability of digital images to resolve the elements of scene),即機關距離内可分辨的最大線對數量
  • 空間分辨率(取樣)(spatial resolution): 圖像中可辨識的最小細節的度量Smallest discernible detail (or spatial size) in an image。空間分辨率的度量必須針對空間機關來規定才有意義。機關距離的線對數和機關距離的**點數(像素數)(印刷出版業,dpi(dots per inch)**是最通用的度量。
  • 灰階分辨率(量化)(gray-level resolution):灰階級中可分辨的最小變化Smallest discernible change in gray level。灰階分辨率指的是用于量化灰階的比特數,最通用的數是8比特。例如,通常說一幅被量化為256灰階級的圖像有8比特的灰階分辨率.
  • 圖像分辨率表示的是能看到圖像細節的多少,依賴于MxN和L

    保持MxN不變而減少L則會導緻僞輪廓

    保持L不變而減少MxN則會導緻取樣棋盤格

  • 空間分辨率和灰階分辨率的變化對圖像品質的影響

    **等偏愛曲線:**在N-k平面内對應于主觀感覺品質相等的曲線

    實驗結果: 當圖像中的細節增加時,等偏愛曲線會更加垂直。

    結論:

    1. 圖像品質一般随N和k的增加而增加,在極少數情況下,對固定的N,減少k能改進品質。最有可能的原因是減少k常能增加圖像的視覺反差
    2. 當N值固定時,這類圖像的感覺品質與所用灰階級數(對于圖2.23所示的灰階級範圍)近似無關。
    3. 對具有大量細節的圖像,隻需很少的灰階級數就可較好的表示
    4. N × k N\times{k} N×k為常數的圖像主觀看起來可以有較大的差異
      數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹
      數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹

2.4.4 圖像内插(image interpolation)

内插廣泛用于放大、收縮、旋轉和幾何校正等進行中,本質上,内插是用已知資料來估計未知位置的數值的處理。

  1. 最近鄰内插:把原圖像中最近鄰的灰階賦給了每個新位置,最簡單,但會造成某些直邊緣嚴重失真。
  2. 雙線性内插:用4個最近鄰點去估計給定位置的灰階,可給出比最近鄰内插好得多的結果,但随之而來的是計算量的增加。注意:雙線性内插不是一種線性内插方法。

    v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d

    其中, v ( x , y ) v(x,y) v(x,y)為 ( x , y ) (x,y) (x,y)處賦予的灰階值。系數可由4個最鄰近點寫出的未知方程确定。

  3. 雙三次内插:用16個最近鄰點,複雜度較高,在保持細節方面比雙線性内插相對要好。雙三次内插是商業圖像編輯軟體Adobe photoshop和Corel Photopaint的标準内插方法。

    v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y)=\sum_{i=0}^3\sum_{j=0}^3{a_{ij}x^iy^j} v(x,y)=i=0∑3​j=0∑3​aij​xiyj

2.5 像素間的一些基本關系

2.5.1 相鄰像素

  • 4鄰域:位于 ( x , y ) (x,y) (x,y)的像素p的4個水準和垂直的相鄰像素,其坐标為:

    ( x + 1 , y ) , ( x − 1 , y ) , ( x , y + 1 ) , ( x , y − 1 ) (x+1, y),(x-1, y),(x, y+1),(x, y-1) (x+1,y),(x−1,y),(x,y+1),(x,y−1)用 N 4 ( p ) N_4(p) N4​(p) 表示。

  • D D D鄰域: p p p的四個對角相鄰像素,坐标為:

    ( x + 1 , y + 1 ) , ( x + 1 , y − 1 ) , ( x − 1 , y + 1 ) , ( x − 1 , y − 1 ) (x+1, y+1),(x+1, y-1),(x-1, y+1),(x-1, y-1) (x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1)用 N D ( p ) N_D(p) ND​(p)表示

  • 8鄰域:p的4鄰域和D鄰域一起構成p的8鄰域,用 N 8 ( P ) N_8(P) N8​(P)表示。
    數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹
    數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹

2.5.2 鄰接性、連通性、區域和邊界

(a) 4-adjacency.Two pixels p and q with values from V are 4-adjacent if q is in the set N 4 ( P ) N_4(P) N4​(P)

(b) 8-adjacency.Two pixels p and q with values from V are 8-adjacent if q is in the set N 8 ( P ) N_8(P) N8​(P)

© m-adjacency (mixed adjacency).Two pixels p and q with values from V are m-adjacent if

(i) q is in N 4 ( P ) N_4(P) N4​(P) or

(ii) q is in N D ( P ) N_D(P) ND​(P)and the set N 4 ( p ) ∩ N 4 ( q ) N_{4}(p) \cap N_{4}(q) N4​(p)∩N4​(q)has no pixels whose values are from V.

  • 通路:像素 p ( x 0 , y 0 ) p(x_0,y_0) p(x0​,y0​)到像素 q ( x n , y n ) q(x_n,y_n) q(xn​,yn​),且其中的每個點與前後兩點是k(k可取4,8,m)鄰接的,則稱p到q是k通路,其中n為通路的長度,若起點p和終點q重合,則稱通路為閉合通路。
  • 連通性:令S是圖像中的一個像素子集。如果S的全部像素之間存在一個通路,則可以說兩個像素p和q在S中是連通的。
  • 區域:令R是圖像中的一個像素子集。如果R是連通集,則稱R為一個區域。在談到區域時,一般考慮4鄰接或8鄰接。必須指定鄰接類型。
  • 區域R的邊界(也稱為邊緣或輪廓)是這樣的點集,這些點與R的補集中的點鄰近。或者說,一個區域的邊界是該區域中至少有一個背景鄰點的像素集。該定義的邊界一般指區域的内邊界,外邊界是指背景邊界。
  • 多數情況下,區域指的是一幅圖像的子集。如果R恰巧是整幅圖像(假設圖像是像素的方形集合),則邊界是由圖像的第一行、第一列和最後一行、最後一列的像素集合來定義。
  • 邊界(boundary)和邊緣(edge)的差別

    邊界(boundary):一個有限區域的邊界形成一條閉合通路,且是“整體”概念。

    邊緣(edge):由具有某些超過預先設定的門檻值的導數值的像素形成,是基于在進行灰階級度量時不連續點的“局部”概念。第**10章在概念上,将邊緣考慮為灰階不連續,把邊界考慮為閉合通路。**邊緣和邊界吻合的一個例外是二值圖像,根據連通類型和所用的邊緣算子(第10章),從二值區域提取邊緣與區域邊界是一樣的。

2.5.3 距離度量

  • 歐式距離 D e D_e De​

對于坐标分别為(x,y),(s,t)和(v,w)的像素p,q和z,若

D(p,q)>=0 [D(p,q) = 0 , 當且僅當p = q] 正定性

D(p,q) = D(q,p) 且 對稱性

D(p,z) <= D(p,q) + D(q,z) 距離三角不等式

則D是距離函數或度量。

歐幾裡得(歐式)距離:

D e ( p , q ) = [ ( x − s ) 2 + ( y − t ) 2 ] 1 2 D_{e}(p, q)=\left[(x-s)^{2}+(y-t)^{2}\right]^{\frac{1}{2}} De​(p,q)=[(x−s)2+(y−t)2]21​

距點(x,y)的距離小于等于某個值r的像素構成以p點為圓心,半徑為r的圓。

  • 城市街區距離 D 4 D_4 D4​

    D 4 ( p , q ) = ∣ x − s ∣ + ∣ y − t ∣ D_{4}(p, q)=|x-s|+|y-t| D4​(p,q)=∣x−s∣+∣y−t∣

    距點(x,y)的距離 D 4 D_4 D4​小于等于某個值r的像素形成一個中心在(x,y)的菱形。

    例如距點(x,y)的距離 D 4 D_4 D4​小于等于2的像素形成的固定距離的輪廓如下:

    2 2 1 2 2 1 0 1 2 2 1 2 2 \begin{array}{llll} & & 2 & \\ & 2 & 1 & 2 \\ 2 & 1 & 0 & 1 & 2 \\ & 2 & 1 & 2 & \\ & & 2 & & \end{array} 2​212​21012​212​2​

  • 棋盤距離 D 8 D_8 D8​

    D 8 ( p , q ) = max ⁡ ( ∣ x − s ∣ , ∣ y − t ∣ ) D_{8}(p, q)=\max (|x-s|,|y-t|) D8​(p,q)=max(∣x−s∣,∣y−t∣)

    距(x,y)的 D 8 D_8 D8​距離小于等于某個值r的像素形成中心在(x,y)的方形。

    例如距中心點的 D 8 D_8 D8​距離小于等于2的像素形成的固定距離的輪廓如下:

    2 2 2 2 2 2 1 1 1 2 2 1 0 1 2 2 1 1 1 2 2 2 2 2 2 \begin{array}{lllll} 2 & 2 & 2 & 2 & 2 \\ 2 & 1 & 1 & 1 & 2 \\ 2 & 1 & 0 & 1 & 2 \\ 2 & 1 & 1 & 1 & 2 \\ 2 & 2 & 2 & 2 & 2 \end{array} 22222​21112​21012​21112​22222​

2.6 數字圖像處理所用數學工具介紹

2.6.1 陣列與矩陣操作

包含一幅或多幅圖像的陣列操作是逐個像素執行的,圖像可以等效地視為矩陣。事實上,在很多情況下,圖像間的操作是用矩陣理論執行的(見2.6.6節)。

陣列相乘(The array product of two images):

[ a 11 a 12 a 21 a 22 ] [ b 11 b 12 b 21 b 22 ] = [ a 11 b 11 a 12 b 12 a 21 b 21 a 22 b 22 ] \left[\begin{array}{ll} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array}\right]\left[\begin{array}{ll} b_{11} & b_{12} \\ b_{21} & b_{22} \end{array}\right]=\left[\begin{array}{ll} a_{11} b_{11} & a_{12} b_{12} \\ a_{21} b_{21} & a_{22} b_{22} \end{array}\right] [a11​a21​​a12​a22​​][b11​b21​​b12​b22​​]=[a11​b11​a21​b21​​a12​b12​a22​b22​​]

矩陣相乘(the matrix product):

[ a 11 a 12 a 21 a 22 ] [ b 11 b 12 b 21 b 22 ] = [ a 11 b 11 + a 12 b 21 a 11 b 12 + a 12 b 22 a 21 b 11 + a 22 b 21 a 21 b 12 + a 22 b 22 ] \left[\begin{array}{ll} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array}\right]\left[\begin{array}{ll} b_{11} & b_{12} \\ b_{21} & b_{22} \end{array}\right]=\left[\begin{array}{ll} a_{11} b_{11}+a_{12} b_{21} & a_{11} b_{12}+a_{12} b_{22} \\ a_{21} b_{11}+a_{22} b_{21} & a_{21} b_{12}+a_{22} b_{22} \end{array}\right] [a11​a21​​a12​a22​​][b11​b21​​b12​b22​​]=[a11​b11​+a12​b21​a21​b11​+a22​b21​​a11​b12​+a12​b22​a21​b12​+a22​b22​​]

若未特别說明,書中均是陣列操作。

2.6.2 線性操作與非線性操作

  • 線性: 加性(疊加性)+同質性(齊次性)
  • H [ f ( x , y ) ] = g ( x , y ) H[f(x, y)]=g(x, y) H[f(x,y)]=g(x,y)其中 H H H為一個一般的算子, f ( x , y ) f(x,y) f(x,y)為輸入圖像, g ( x , y ) g(x,y) g(x,y)為輸出圖像,若:

    H [ a i f i ( x , y ) + a j f j ( x , y ) ] = a i H [ f i ( x , y ) ] + a j H [ f j ( x , y ) ] = a i g i ( x , y ) + a j g j ( x , y ) \begin{aligned} H\left[a_{i} f_{i}(x, y)+a_{j} f_{j}(x, y)\right] &=a_{i} H\left[f_{i}(x, y)\right]+a_{j} H\left[f_{j}(x, y)\right] \\ &=a_{i} g_{i}(x, y)+a_{j} g_{j}(x, y) \end{aligned} H[ai​fi​(x,y)+aj​fj​(x,y)]​=ai​H[fi​(x,y)]+aj​H[fj​(x,y)]=ai​gi​(x,y)+aj​gj​(x,y)​ w h e r e   a i , a j , f i ( x , y ) a n d f j ( x , y )   a r e   a r b i t r a r y   c o n s t a n t s   a n d   i m a g e s   ( o f   t h e   s a m e   s i z e ) , r e s p e c t i v e l y where\ a_i,a_j,f_i(x,y)andf_j(x,y)\ are\ arbitrary\ constants\ and\ images\ (of\ the\ same\ size), respectively where ai​,aj​,fi​(x,y)andfj​(x,y) are arbitrary constants and images (of the same size),respectively則 H H H是線性的.

  • 結論:

    求和算子是線性的。

    通常求最大值的操作是非線性的。

2.6.3 算術操作

  • 圖像間的算術操作是陣列操作,即算術操作在相應的像素對之間執行。(圖像算術操作涉及相同大小的圖像)。
  • 帶噪圖像(帶有噪聲的圖像)相加(平均)可降噪
  • 圖像相減增強差别
  • 圖像相乘(或相除)用于陰影校正
  • 圖像相乘的另一種普通應用是模闆操作,也稱為感興趣區域(Region of Interest, ROI)操作。
  • 圖像标定

    給定一幅圖像f,保證圖像間算術操作的整個值域落入某個固定比特數的方法如下。首先執行操作:

    f m = f − m i n ( f ) f_m=f-min(f) fm​=f−min(f)

    該操作生成最小值為0的一幅圖像。然後再執行操作:

    f s = K [ f m / m a x ( f m ) ] f_s=K[f_m/max(f_m)] fs​=K[fm​/max(fm​)]

    該操作生成一幅标定的圖像 f s f_s fs​,其值在範圍 [ 0 , K ] [0,K] [0,K]内。在執行除法操作時,要避免除以0的情況發生,要加上一個很小的數,MATLAB程式設計時,+eps

2.6.4 集合和邏輯操作

  • 集合操作

    圖像中的邏輯操作主要以像素對像素為基礎,在兩幅或多幅圖像間進行。

    灰階值的并集操作和交集操作通常分别定義為相應像素對的最大和最小。而補集操作定義為常數( 2 k − 1 2^k-1 2k−1)與圖像中每個像素的灰階間的兩兩之差。

  • 邏輯操作

    or and not xor

2.6.5 空間操作

  1. 單像素操作

    以灰階為基礎改變單個像素的值。

  2. 鄰域操作

    令 S x y S_{xy} Sxy​代表圖像中以任意一點 ( x , y ) (x,y) (x,y)為中心的一個鄰域的坐标集。鄰域處理在輸出圖像 g g g中的相同坐标處生成一個相應的像素,假設指定的操作是計算在大小為 m × n m\times{n} m×n、中心在 ( x , y ) (x,y) (x,y)的矩形鄰域中的像素的平均值。

    則:

    g ( x , y ) = 1 m n ∑ ( r , c ) ∈ S x y f ( r , c ) g(x, y)=\frac{1}{m n} \sum_{(r, c) \in S_{xy}} f(r, c) g(x,y)=mn1​(r,c)∈Sxy​∑​f(r,c)

  3. 幾何空間變換
  • 幾何變換改進圖像像素間的關系。
  • 基本操作組成如下:

    (1)坐标的空間變換

    (2)灰階内插,即對空間變換後的像素賦灰階值。

  • 最常用的空間坐标變換之一是仿射變換: [ x y 1 ] = [ v w 1 ] T = [ v w 1 ] [ t 11 t 12 0 t 21 t 22 0 t 31 t 32 1 ] [x y 1]=\left[\begin{array}{lllll} v & w & 1 \end{array}\right] \mathbf{T}=\left[\begin{array}{lll} v & w & 1 \end{array}\right]\left[\begin{array}{lll} t_{11} & t_{12} & 0 \\ t_{21} & t_{22} & 0 \\ t_{31} & t_{32} & 1 \end{array}\right] [xy1]=[v​w​1​]T=[v​w​1​]⎣⎡​t11​t21​t31​​t12​t22​t32​​001​⎦⎤​
    數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹
  • 圖像配準

    圖像配準用于對齊兩幅或多幅相同場景的圖像。在圖像配準中,主要問題是估計變換函數,然後用它配準兩幅圖像。

    數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹

2.6.6 向量與矩陣操作

多光譜圖像處理是使用向量和矩陣操作的典型領域

2.6.7 圖象變換

  • 目前為止讨論的所有圖像處理方法,都直接工作在空間域。在有些情況下,通過變換輸入圖像來表達圖像處理任務,在變換域執行指定任務,之後再用反變換傳回到空間域,更為可取。表示為 T(u,v)的二維線性變換是一類特别重要的變換,其通用形式可表達為:

    T ( u , v ) = ∑ x = 0 M − 1 ∑ y = 0 N − 1 f ( x , y ) r ( x , y , u , v ) T(u, v)=\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} f(x, y) r(x, y, u, v) T(u,v)=x=0∑M−1​y=0∑N−1​f(x,y)r(x,y,u,v)

    式中, f ( x , y ) f(x,y) f(x,y)是輸入圖像, r ( x , y , u , v ) r(x, y, u, v) r(x,y,u,v) 稱為正變換核。給定 T ( u , v ) T(u, v) T(u,v)後,我們可以用 T ( u , v ) T(u, v) T(u,v)的反變換還原 f ( x , y ) f(x,y) f(x,y):

    f ( x , y ) = ∑ u = 0 M − 1 ∑ v = 0 N − 1 T ( u , v ) s ( x , y , u , v ) f(x, y)=\sum_{u=0}^{M-1} \sum_{v=0}^{N-1} T(u, v) s(x, y, u, v) f(x,y)=u=0∑M−1​v=0∑N−1​T(u,v)s(x,y,u,v)式中, s ( x , y , u , v ) s(x, y,u,v) s(x,y,u,v) 稱為反變換核。

數字圖像處理第三版(岡薩雷斯)——第二章數字圖像基礎2.1 視覺感覺要素2.2 光和電磁波譜2.3 圖像感覺和擷取2.4 圖像取樣和量化2.4.4 圖像内插(image interpolation)2.5 像素間的一些基本關系2.6 數字圖像處理所用數學工具介紹
  • 二維傅裡葉變換有如下正、反變換核:

    r ( x , y , u , v ) = e − j 2 π ( u x / M + v y / N ) r(x, y, u, v)=\mathrm{e}^{-\mathrm{j} 2 \pi(u x / M+v y / N)} r(x,y,u,v)=e−j2π(ux/M+vy/N)

    s ( x , y , u , v ) = 1 M N e j 2 π ( u x / M + v y / N ) s(x, y, u, v)=\frac{1}{M N} \mathrm{e}^{\mathrm{j} 2 \pi(u x / M+v y / N)} s(x,y,u,v)=MN1​ej2π(ux/M+vy/N)

    離散傅裡葉變換對:

    T ( u , v ) = ∑ x = 0 M − 1 ∑ y = 0 N − 1 f ( x , y ) e − j 2 π ( u x / M + v y / N ) T(u, v)=\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} f(x, y) \mathrm{e}^{-\mathrm{j} 2 \pi(u x / M+v y / N)} T(u,v)=x=0∑M−1​y=0∑N−1​f(x,y)e−j2π(ux/M+vy/N)

    f ( x , y ) = 1 M N ∑ u = 0 M − 1 ∑ v = 0 N − 1 T ( u , v ) e j 2 π ( u x / M + v y / N ) f(x, y)=\frac{1}{M N} \sum_{u=0}^{M-1} \sum_{v=0}^{N-1} T(u, v) \mathrm{e}^{\mathrm{j} 2 \pi(u x / M+v y / N)} f(x,y)=MN1​u=0∑M−1​v=0∑N−1​T(u,v)ej2π(ux/M+vy/N)

2.6.8 機率方法

例如,令 z i , i = 0 , 1 , 2 , ⋯   , L − 1 z_{i}, i=0,1,2, \cdots, L-1 zi​,i=0,1,2,⋯,L−1表示一幅 M × N M\times{N} M×N大小數字圖像中所有可能的灰階值,則在給定圖像中灰階級 Z k Z_k Zk​出現的機率 P ( Z k ) P(Z_k) P(Zk​)可估計為

p ( z k ) = n k M N p\left(z_{k}\right)=\frac{n_{k}}{M N} p(zk​)=MNnk​​式中, n k n_k nk​是灰階 Z k Z_k Zk​在圖像中出現的次數,MN 是像素總數。顯然:

∑ k = 0 L − 1 p ( z k ) = 1 \sum_{k=0}^{L-1} p\left(z_{k}\right)=1 k=0∑L−1​p(zk​)=1

平均灰階:

m = ∑ k = 0 L − 1 z k p ( z k ) m=\sum_{k=0}^{L-1} z_{k} p\left(z_{k}\right) m=k=0∑L−1​zk​p(zk​)

灰階的方差是: σ 2 = ∑ k = 0 L − 1 ( z k − m ) 2 p ( z k ) \sigma^{2}=\sum_{k=0}^{L-1}\left(z_{k}-m\right)^{2} p\left(z_{k}\right) σ2=k=0∑L−1​(zk​−m)2p(zk​)

方差是Z值關于均值的展開度的度量,是以它是圖像對比度的有用度量。通常,随機變量關于均值的第階矩定義為 μ n ( z ) = ∑ k = 0 L − 1 ( z k − m ) n p ( z k ) \mu_{n}(z)=\sum_{k=0}^{L-1}\left(z_{k}-m\right)^{n} p\left(z_{k}\right) μn​(z)=k=0∑L−1​(zk​−m)np(zk​)

注:本人初學數字圖像處理,将學習筆記記錄于此,書本圖檔庫、英文原版電子書等相關學習資源歡迎關注微信公衆号痕中光擷取。

繼續閱讀