系統性綜述：特征點檢測與比對

作者丨夢寐mayshine@知乎（已授權）

編輯丨極市平台

導讀

本文先從圖像特征開始介紹，後分點闡述特征子和描述子的相關分類及特點，最後以圖像展示了特征比對的關系，完整的叙述了整個模組化過程中特征點檢測與比對的知識。

一、圖像特征介紹

1、圖像特征點的應用

相機标定：棋盤格角點陰影格式固定，不同視角檢測到點可以得到比對結果，标定相機内參
圖像拼接：不同視角比對恢複相機姿态
稠密重建：間接使用特征點作為種子點擴散比對得到稠密點雲
場景了解：詞袋方法，特征點為中心生成關鍵詞袋（關鍵特征）進行場景識别

2、圖像特征點的檢測方法

人工設計檢測算法：sift、surf、orb、fast、hog
基于深度學習的方法：人臉關鍵點檢測、3D match點雲比對
場景中的人工标記點：影視場景背景簡單的标記，特殊二維碼設計（快速，精度低）

3、圖像特征點的基本要求

差異性：視覺上場景上比較顯著點，灰階變化明顯，邊緣點等
重複性：同一個特征在不同視角中重複出現，旋轉、光度、尺度不變性

二、特征檢測子

1、Harris 角點檢測（早期，原理簡單，視訊跟蹤，快速檢測）

夢寐mayshine：角點檢測(2) - harris算子 - 理論與Python代碼

https://zhuanlan.zhihu.com/p/90393907

動機：特征點具有局部差異性
以每個點為中心取一個視窗，例如，5×5/7×7的像素，描述特征點周圍環境
此點具有差異性->視窗往任意方向移動，則周圍環境變化較大->具有局部差異性
最小二乘線性系統一階泰勒展開（消除重複項）
加和符号：表示視窗内每個像素
w：表示權重，權值1或者以點為中心的高斯權重（離點越近權重越大）
I：表示像素，RGB/灰階
u，v：視窗移動的方向
H：harris矩陣，由兩個方向上的梯度建構而成
圖像梯度：
Harris矩陣：
Harris矩陣H 的特征值分析
兩個特征值反映互相垂直方向上的變化情況，分别代表變化最快和最慢的方向，特征值大變化快，特征值小變化慢
λ1 ≈ λ2 ≈ 0，兩個方向上變化都很小，興趣點位于光滑區域
λ1 > 0 , λ2 ≈ 0 ，一個方向變化快，一個方向變化慢，興趣點位于邊緣區域
λ1 , λ2 > 0 ，兩個方向變化都很快，興趣點位于角點區域（容易判斷）

Harris角點準則代替矩陣分解：
反映特征值情況，trace為迹
k的值越小，檢測子越敏感
隻有當λ1和λ2同時取得最大值時，C才能取得較大值
避免了特征值分解，提高檢測計算效率
非極大值抑制(Non-maximal Suppression) 選取局部響應最大值，避免重複的檢測
算法流程：
0）濾波、平滑，避免出現階躍函數
1）計算圖像水準和垂直方向的梯度
2）計算每個像素位置的Harris矩陣
3）計算每個像素位置的Harris角點響應值
3+）非極大值抑制
4）找到Harris角點響應值大于給定門檻值且局部最大的位置作為特征點
檢測結果：

2、基于LoG的多尺度特征檢測子

動機：Harris角點檢測不具有尺度不變性，讓特征點具有尺度不變性

解決方法：尺度歸一化LoG算子，處理尺度的變化
LoG算子：Lindeberg(1993)提出Laplacian of Gaussian (LoG)函數的極值點對應着特征點
尺度空間：

LoG算子[1]形式：高斯濾波性質：卷積->求拉普拉斯算子==求拉普拉斯算子->卷積其中是LoG算子
尺度歸一化LoG[2]（使得具有可比性=匯率）：其中是尺度歸一化LoG算子
不同尺度下的LoG響應值不具有可比性
建構尺度空間，同時在位置空間和尺度空間尋找歸一化LoG極值(極大 /極小)點作為特征點
不同尺度下

LoG特征檢測算法流程
1）計算不同尺度上的尺度歸一化LoG函數值
2）同時在位置和尺度構成的三維空間上尋找尺度歸一化LoG的極值點
3）進行非極大值抑制，減少重複檢測（去除備援、保持穩定性）
檢測結果：效果好，LoG計算量大

3、基于DoG的多尺度特征檢測子（SIFT）——穩定和魯棒

LoG可以由DoG近似：Lowe(2004)提出歸一化LoG近似等價于相鄰尺度的高斯差分(DoG)
高斯空間：
高斯差分DoG：相鄰的空間做差，極點處對應特征點
尺度空間的建構

階數：O=3 （octave=階，每階圖像尺寸減少一半,階數高->運算量大->尺度變化大）
每階有效差分數：S=3（每個階内劃分數）
每階層數：N=S+3
高斯空間
高斯差分
有效差分
任意設定

特征點位置的确定：
1）尺度空間和圖像空間上：3*3視窗，26個鄰域，找極值點比其他都要大DoG，LoG找極大值或極小值
2）橫軸向代表離散位置，縱軸代表DoG響應值，在極值點鄰域内求二階函數的極值=準确像素位置

亞像素特征點位置的确定

x：
f(x)：
x0：
任務：在x0附近近似一個二階函數，求二階函數極值得到更準确的亞像素極值位置

矩陣的表達-1階

矩陣的表達-2階

極值點有可能是邊緣點，->除去邊緣點：DoG在邊緣處值較大，需要避免檢測到邊緣點
計算主方向：通過統計梯度直方圖的方法确定主方向，使算法具有旋轉不變性

SIFT特征檢測流程：旋轉不變性、尺度不變性、亮度變化不變性，對視角變化、仿射變換有一定程度的穩定性

1）計算圖像尺度空間：
2）DoG極值點檢測與定位：保留的特征點
3）邊緣點去除：
4）計算主方向
5）生成描述子
6）檢測結果

4、快速特征點檢測方法：——實時性要求高

FAST特征點[3]：Feature from Accelerated Segment Test

1）以候選點p為圓心建構一個離散圓
2）比較圓周上的像素與p點像素值
3）當有連續的n個像素值明顯亮于或者暗于p時，p被檢測為特征點，例Fast9,Fast12
特性：通過檢測局部像素灰階變化來确認特征點的位置，速度快，SIFT的100倍；不具有尺度和旋轉不變性
流程：
檢測：

Oriented FAST (ORB)

擷取尺度不變性：建構圖像金字塔，在金字塔每一層上檢測關鍵點
擷取旋轉不變性：通過灰階質心法(Intensity Centroid) 确定圖像主方向
圖像塊B上的矩定義為：
圖像塊B的質心定義為：
計算方向角：
檢測結果：

三、特征描述子

特征描述子 Feature Descriptor

每個特征點獨特的身份認證
同一空間點在不同視角的特征點具有高度相似的描述子
不同特征點的的描述子差異性盡量大
通常描述子是一個具有固定長度的向量

特征支援區域

主方向:進行旋轉并重新插值
特征尺度:影響支援區域的大小

1、基于直方圖的描述子

（1）用于微小運動的描述子 [4]（e.g.相鄰兩幀視訊）

定義：以特征點為中心的矩形區域内所有像素的灰階值作為描述子
特性：适用于微小變化的圖像對圖像存在明顯的旋轉、尺度、光照和透視變換時不穩定

（2）Sift描述子——旋轉主方向

定義：根據主方向對支援區域進行旋轉，并通過雙線性插值重構
特性：圖像歸一化處理，去除光照變化

統計局部梯度資訊流程：

1）将區域劃分成4x4的block ；
2）每個block内統計梯度方向的直方圖(高斯權重梯度作為系數)

（2）Sift描述子——生成描述子

（2）Sift描述子——歸一化處理

處理方式

1）門限處理-直方圖每個方向的梯度幅值不超過0.2
2）描述子長度歸一化

特性：歸一化處理提升了特征點光度變化的不變性
SIFT描述子變種：PCA-SIFT/SURF

（3）GLOH描述子[5]：Gradient Location-orientation Histogram

一共有1+2x8=17 個blocks
每個blocks計算16個方向的直方圖
描述子共16x17=272維
通過PCA可以降維到128

（4）DAISY描述子[6]：每個圓的半徑對應高斯的尺度

2、基于不變性的描述子

3、二進制描述子——BRIEF

描述子形式：描述向量由N個0或者1組成 N=128,256,512
描述子特性：生成速度快（漢明距離），比對效率高，簡單有效；不具有旋轉不變性
描述子流程：

1）圖像進行如高斯濾波預處理——去除噪聲
2）在支援區域内随機采樣N對大小5×5的patch
3）比較patch内像素和的大小，并保留結果構成特征向量 $\tau(p;x,y)=\left\{ \begin{aligned} 1, \ \ \ \ ifp(x)<p(y) \\ 0, \ otherwise \end{aligned} \right.$ p(x),p(y)是履歷在x，y處的patch< section>

四、特征比對

計算兩幅圖像中特征描述子的比對關系

1、距離度量

歸一化互相關，1 ->非常比對，0->不比對

2、比對政策

最近鄰：加了距離限制，防止孤立點

3、高效比對

4、特征比對驗證

參考

T. Lindeberg. Detecting salient blob-like image structures and their scales with a scalespace primal sketch: A method for focus-of-attention. International Journal of Computer Vision, 11(3):283–318, Dec. 1993.
T. Lindeberg. Feature detection with automatic scale selection. International Journal of Computer Vision, 30(2):79–116, Nov. 1998.
E. Rosten and T. Drummond. Fusing points and lines for high performance tracking. In IEEE International Conference on Computer Vision (ICCV), 2005.
Scharstein, D. and Szeliski, R. (2002). A taxonomy and evaluation of dense two-framestereo correspondence algorithms. International Journal of Computer Vision, 47(1):7–42.
Mikolajczyk, K. and Schmid, C. (2005). A performance evaluation of local descriptors.IEEE Transactions on Pattern Analysis and Machine Intelligence, 27(10):1615–1630.
S. Winder and M. Brown. Learning local image descriptors. In IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2007.

本文僅做學術分享，如有侵權，請聯系删文。

▲長按關注公衆号

系統性綜述：特征點檢測與比對

一、圖像特征介紹

二、特征檢測子

三、特征描述子

四、特征比對

繼續閱讀

Cesium左鍵點選模型效果分析

QPBOC封包解析

Docker - Docker資料持久化

Direct-X學習筆記--三維粒子系統

基于 WebGL 的 HTML5 3D 棉花加工監控系統

中自蘇研院2021招聘季開始啦！

招聘|追覓科技VSLAM、CV算法實習生招聘

【Qt】添加3D場景到widget中

pycharm 2019.2.1 注冊方法

Matlab 連通分量處理，二維和三維 (Matlab, Connected Component Process, 2D&3D)

3D輕量化的三大應用解決方案

資料的歸一化（Normalization）、标準化（Standardization）

基于改進FCOS的鋼帶表面缺陷檢測

solidworks包覆無法選中浮雕或蝕雕解決方法問題出現的原因

資料挖掘-歸一化

Cesium格式3dtile制作工具