人臉識别實踐

很多人都認為人臉識别是一項非常難以實作的工作，看到名字就害怕，然後心懷忐忑到網上一搜，看到網上n頁的教程立馬就放棄了。這些人裡包括曾經的我自己。其實如果如果你不是非要深究其中的原理，隻是要實作這一工作的話，人臉識别也沒那麼難。今天我們就來看看如何在40行代碼以内簡單地實作人臉識别。

今天我們要做的是人臉識别。

anaconda 2 —— python 2

dlib

scikit-image

對于今天要用到的主要工具，還是有必要多說幾句的。dlib是基于現代c++的一個跨平台通用的架構，作者非常勤奮，一直在保持更新。dlib内容涵蓋機器學習、圖像處理、數值算法、資料壓縮等等，涉獵甚廣。更重要的是，dlib的文檔非常完善，例子非常豐富。就像很多庫一樣，dlib也提供了python的接口，安裝非常簡單，用pip隻需要一句即可：

上面需要用到的<code>scikit-image</code>同樣隻是需要這麼一句：

注：如果用 <code>pip install dlib</code> 安裝失敗的話，那安裝起來就比較麻煩了。錯誤提示很詳細，按照錯誤提示一步步走就行了。

之是以用 dlib 來實作人臉識别，是因為它已經替我們做好了絕大部分的工作，我們隻需要去調用就行了。dlib裡面有人臉檢測器，有訓練好的人臉關鍵點檢測器，也有訓練好的人臉識别模型。今天我們主要目的是實作，而不是深究原理。感興趣的同學可以到官網檢視源碼以及實作的參考文獻。

今天的例子既然代碼不超過40行，其實是沒啥難度的。有難度的東西都在源碼和論文裡。

首先先通過檔案樹看一下今天需要用到的東西：

準備了六個候選人的圖檔放在 <code>candidate-faces</code> 檔案夾中，然後需要識别的人臉圖檔 <code>test.jpg</code> 。我們的工作就是要檢測到 <code>test.jpg</code> 中的人臉，然後判斷她到底是候選人中的誰。

另外的 <code>girl-face-rec.py</code> 是我們的python腳本。<code>shape_predictor_68_face_landmarks.dat</code>是已經訓練好的人臉關鍵點檢測器。<code>dlib_face_recognition_resnet_model_v1.dat</code> 是訓練好的resnet人臉識别模型。resnet是何凱明在微軟的時候提出的深度殘差網絡，獲得了 imagenet 2015 冠軍，通過讓網絡對殘差進行學習，在深度和精度上做到了比 cnn 更加強大。

然後準備幾個人的人臉圖檔作為候選人臉，最好是正臉。放到 <code>candidate-faces</code> 檔案夾中。

本文這裡準備的是六張圖檔，如下：

她們分别是

然後準備四張需要識别的人臉圖像，其實一張就夠了，這裡隻是要看看不同的情況：

可以看到前兩張和候選檔案中的本人看起來還是差别不小的，第三張是候選人中的原圖，第四張圖檔微微側臉，而且右側有陰影。

資料準備完畢，接下來就是代碼了。識别的大緻流程是這樣的：

先對候選人進行人臉檢測、關鍵點提取、描述子生成後，把候選人描述子儲存起來。

然後對測試人臉進行人臉檢測、關鍵點提取、描述子生成。

最後求測試圖像人臉描述子和候選人臉描述子之間的歐氏距離，距離最小者判定為同一個人。

代碼不做過多解釋，因為已經注釋的非常完善了。以下是 <code>girl-face-rec.py</code>

我們在<code>.py</code>所在的檔案夾下打開指令行，運作如下指令

<code>python girl-face-rec.py 1.dat 2.dat ./candidate-faecs test1.jpg</code>

由于 <code>shape_predictor_68_face_landmarks.dat</code> 和 <code>dlib_face_recognition_resnet_model_v1.dat</code> 名字實在太長，是以我把它們重命名為 <code>1.dat</code> 和 <code>2.dat</code> 。

運作結果如下：

記憶力不好的同學可以翻上去看看 <code>test1.jpg</code> 是誰的圖檔。有興趣的話可以把四張測試圖檔都運作下試試。

這裡需要說明的是，前三張圖輸出結果都是非常理想的。但是第四張測試圖檔的輸出結果是候選人4。對比一下兩張圖檔可以很容易發現混淆的原因。

機器畢竟不是人，機器的智能還需要人來提升。

有興趣的同學可以繼續深入研究如何提升識别的準确率。比如每個人的候選圖檔用多張，然後對比和每個人距離的平均值之類的。全憑自己了。

<a></a>

人臉識别實踐

繼續閱讀

筆試面試題目：滑動視窗(二)

27. Remove Element(清單)題目代碼

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

C經典書籍筆記——C陷阱與缺陷②(文法陷阱之優先級)一、錯誤案列二、優先級規律

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

線性表之順序表的實作

C++判斷素數、求最大公約數代碼判斷一個數是否為素數求兩個數的最大公約數

SequoiaDB巨杉資料庫C++驅動概述

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入

hdu7108哈希