OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

上一篇文章中介紹了如何使用OpenCV自帶的haar分類器進行人臉識别（點我打開）。

這次我試着自己去訓練一個haar分類器，前後花了兩天，最後總算是訓練完了。不過效果并不是特别理想，由于我是在自己的筆記本上進行訓練，為減少訓練時間我的樣本量不是很大，最後也隻是勉強看看效果了。網上有關的資料和部落格可以說很多了，隻要耐心點總是能成功的。

采集樣本：

首先要訓練，就得有訓練集。網上有很多國外高校開源的庫可供下載下傳：

1、卡耐基梅隆大學圖像資料庫（點我打開）

2、MIT人臉資料庫（點我打開）

3、ORL人臉資料庫（點我打開）

由于是國外的網站，可能需要翻牆，是以下載下傳可能會有些麻煩。這裡給出了我在網上收集的訓練集，正樣本為20*20的人臉圖檔，負樣本為50*50的背景圖檔。樣本集下載下傳位址：http://download.csdn.net/detail/hongbin_xu/9887672。

準備工作：

在指定目錄中放入以下所提到的檔案夾及檔案。

将正樣本放在pos檔案夾中，負樣本放在neg檔案夾中，xml檔案夾存放後面訓練過程中産生的資料模型，最後opencv會将其轉換生成一個xml檔案，也就是最終的分類器。

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

從OpenCv安裝目錄中查找出如下兩個exe可執行檔案。

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

opencv_createsamples.exe：用于建立樣本描述檔案，字尾名是.vec。專門為OpenCV訓練準備，隻有正樣本需要，負樣本不需要。

opencv_haartraining.exe：是OpenCV自帶的一個工具，封裝了haar特征提取以及adaboost分類器訓練過程。

一般來說，正負樣本數目比例在1：3的時候訓練結果比較好，但是不是絕對。由于每個樣本的差異性不同等因素，是以沒有絕對的比例關系。但是負樣本需要比正樣本多，因為原則上說負樣本的多樣性越大越好，我們才能有效降低誤檢率，而不僅僅是通過正樣本的訓練讓其能識别物體。為了節約時間，我選了1500個正樣本和4500個負樣本。

擷取樣本路徑清單：

打開Windows下的指令行視窗，進入指定目錄下。

1、建立正樣本的描述檔案：

首先進入pos檔案夾中，輸入：

dir /b > pos.txt

在目前pos目錄下生成一個pos.txt記錄所有圖檔的名稱。

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

打開記事本，去除pos.txt最後一行的pos檔案夾；

将所有

jpg

替換成

jpg 1 0 0 20 20

。這裡1表示目前圖檔重複出現的次數是1， 0 0 20 20表示目标圖檔大小是矩形框從（0，0）到（20，20）。

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

2、建立負樣本的描述檔案：

接下來重新進入neg檔案夾，輸入：

之後，生成neg.txt檔案，這裡負樣本不做其他修改。

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

3、使用opencv_createsamples.exe建立訓練需要的參數清單：

Windows控制台進入指定目錄下，我們之前已經在目錄下放了opencv_createsamples.exe檔案，在控制台下輸入opencv_createsamples.exe可以得到各參數資訊：

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

在目前目錄下輸入如下指令：

opencv_createsamples.exe -vec pos.vec -info pos\pos.txt -bg neg\neg.txt -w  -h  -num  ；

目前目錄下，産生了pos.vec檔案。

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

簡要介紹指令：

-vec pos.vec：指定生成的檔案，最終生成的就是pos.vec；

-info pos\pos.txt：目标圖檔描述檔案，在pos\pos.txt；

-bg neg\neg.txt：背景圖檔描述檔案，在neg\neg.txt；

-w 20：輸出樣本的寬度，20；

-h 20：輸出樣本的高度，20；

-num 1500：要産生的正樣本數量，1500；

訓練模型：

Windows控制台進入指定目錄下，我們之前已經在目錄下放了opencv_haartraining.exe檔案，在控制台下輸入opencv_haartraining.exe可以得到各參數資訊：

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

輸入如下指令進行訓練：

簡要介紹指令：

-vec pos.vec：正樣本檔案名；

-bg neg\neg.txt：背景描述檔案；

-data xml：指定存放訓練好的分類器的路徑名，也就是前面建立的xml檔案夾；

-w 20：樣本圖檔寬度，20；

-h 20：樣本圖檔高度，20；

-mem 1024：提供的以MB為機關的記憶體，很明顯，這個值越大，提供的記憶體越多，運算也越快；

-npos 1000：取1000個正樣本，小于總正樣本數；

-neg 3000：取3000個負樣本，小于總負樣本數；

-nstages 2：指定訓練層數，層數越高耗時越長；

-nsplits 5：分裂子節點數目, 預設值為2；

其他參數：

-minhitrate：最小命中率，即訓練目标準确度；

-maxfalsealarm：最大虛警(誤檢率)，每一層訓練到這個值小于0.5時訓練結束，進入下一層訓練；

-sym或者-nonsym：臉是否垂直對稱，若是，則選前者，且可以加快訓練速度。

輸入指令之後就是等待了，最後可以看到結果如下：

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

這裡我的層數太少了，導緻訓練結果不是很好，一般要增加到15~20層才能有較好的效果。

中間可能遇到的問題：

可能在訓練的過程中，過了很長時間但是卻一直停留在某一層不動，上網查找解決辦法如下：增大負樣本數目，增大負樣本之間的變化! 增加負樣本，然後重新接着訓練，注意更改負樣本的數目。

詳細說明可以檢視：http://blog.csdn.net/jimeshui/article/details/42039615

參考連結：

1.http://blog.csdn.net/yangleo1987/article/details/52883864

2.http://blog.csdn.net/u014365862/article/details/52997019

OpenCV學習記錄（二）：自己訓練haar特征的adaboost分類器進行人臉識别

采集樣本：

準備工作：

擷取樣本路徑清單：

訓練模型：

中間可能遇到的問題：

繼續閱讀

Ubuntu16.04下Caffe環境搭建：cuda8.0 + opencv2.4.13

Ubuntu下安裝OpenCV2.4.13

ubuntu 14.04安裝opencv2.4.13

opencv2.4.13在ubuntu14.04上的安裝

ubuntu16.10 下opencv2.4.13安裝配置

Ubuntu20.04下配置OpenCV2.4.13

ubuntu14.04 編譯安裝OpenCV 3.2

opencv學習筆記（十四）——圖像像素的通路

opencv028-輪廓發現

qt-opencv圖像增強之邊緣檢測（多線程）1 .pro項目檔案配置2 ui設計3 多線程邏輯4 Canny邊緣檢測和Laplace算子5 主要代碼6 運作結果

DLP面曝光3D列印機模型資料矯正

VS2010 / MFC + OpenCV 2.4.9打開圖檔

2021-09-30三維點雲測量正方形包裹體積

Gsl在VS2008下的配置和使用

如何用Opencv求圖像的灰階投影曲線

opencv——圖像的灰階處理（線性變換/拉伸/直方圖/均衡化）