天天看點

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

轉自:https://blog.csdn.net/dcrmg/article/details/52561656

一、 圖像金字塔

圖像金字塔是一種以多分辨率來解釋圖像的結構,通過對原始圖像進行多尺度像素采樣的方式,生成N個不同分辨率的圖像。把具有最進階别分辨率的圖像放在底部,以金字塔形狀排列,往上是一系列像素(尺寸)逐漸降低的圖像,一直到金字塔的頂部隻包含一個像素點的圖像,這就構成了傳統意義上的圖像金字塔。

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

獲得圖像金字塔一般包括二個步驟:

1. 利用低通濾波器平滑圖像 

2. 對平滑圖像進行抽樣(采樣)

有兩種采樣方式——上采樣(分辨率逐級升高)和下采樣(分辨率逐級降低)

上采樣:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

下采樣:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

二、高斯金字塔

高斯金字塔式在Sift算子中提出來的概念,首先高斯金字塔并不是一個金字塔,而是有很多組(Octave)金字塔構成,并且每組金字塔都包含若幹層(Interval)。

高斯金字塔建構過程:

1. 先将原圖像擴大一倍之後作為高斯金字塔的第1組第1層,将第1組第1層圖像經高斯卷積(其實就是高斯平滑或稱高斯濾波)之後作為第1組金字塔的第2層,高斯卷積函數為:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

對于參數σ,在Sift算子中取的是固定值1.6。

2. 将σ乘以一個比例系數k,等到一個新的平滑因子σ=k*σ,用它來平滑第1組第2層圖像,結果圖像作為第3層。

3. 如此這般重複,最後得到L層圖像,在同一組中,每一層圖像的尺寸都是一樣的,隻是平滑系數不一樣。它們對應的平滑系數分别為:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。

4.  将第1組倒數第三層圖像作比例因子為2的降采樣,得到的圖像作為第2組的第1層,然後對第2組的第1層圖像做平滑因子為σ的高斯平滑,得到第2組的第2層,就像步驟2中一樣,如此得到第2組的L層圖像,同組内它們的尺寸是一樣的,對應的平滑系數分别為:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。但是在尺寸方面第2組是第1組圖像的一半。

這樣反複執行,就可以得到一共O組,每組L層,共計O*L個圖像,這些圖像一起就構成了高斯金字塔,結構如下:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

在同一組内,不同層圖像的尺寸是一樣的,後一層圖像的高斯平滑因子σ是前一層圖像平滑因子的k倍;

在不同組内,後一組第一個圖像是前一組倒數第三個圖像的二分之一采樣,圖像大小是前一組的一半;

高斯金字塔圖像效果如下,分别是第1組的4層和第2組的4層:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間
高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

三、 尺度空間

圖像的尺度空間解決的問題是如何對圖像在所有尺度下描述的問題。

在高斯金字塔中一共生成O組L層不同尺度的圖像,這兩個量合起來(O,L)就構成了高斯金字塔的尺度空間,也就是說以高斯金字塔的組O作為二維坐标系的一個坐标,不同層L作為另一個坐标,則給定的一組坐标(O,L)就可以唯一确定高斯金字塔中的一幅圖像。

尺度空間的形象表述:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

上圖中尺度空間中k前的系數n表示的是第一組圖像尺寸是目前組圖像尺寸的n倍。

四、 DOG金字塔

差分金字塔,DOG(Difference of Gaussian)金字塔是在高斯金字塔的基礎上建構起來的,其實生成高斯金字塔的目的就是為了建構DOG金字塔。

DOG金字塔的第1組第1層是由高斯金字塔的第1組第2層減第1組第1層得到的。以此類推,逐組逐層生成每一個差分圖像,所有差分圖像構成差分金字塔。概括為DOG金字塔的第o組第l層圖像是有高斯金字塔的第o組第l+1層減第o組第l層得到的。

DOG金字塔的建構可以用下圖描述:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

每一組在層數上,DOG金字塔比高斯金字塔少一層。後續Sift特征點的提取都是在DOG金字塔上進行的。

DOG金字塔的顯示效果如下:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

這些長得黑乎乎的圖像就是差分金字塔的實際顯示效果,隻在第1組第1層差分圖像上模糊可以看到一個輪廓。但其實這裡邊包含了大量特征點資訊,隻是我們人眼已經分辨不出來了。

下邊對這些DOG圖像進行歸一化,可有很明顯的看到差分圖像所蘊含的特征,并且有一些特征是在不同模糊程度、不同尺度下都存在的,這些特征正是Sift所要提取的“穩定”特征:

高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔及SIFT算法中的尺度空間

繼續閱讀