天天看點

基于神經網絡的人臉識别知識普及(一)

Google 的 FaceNet 用的是 Triplet Loss,這跟它自己的資料量有直接關系,之前那幾個論文都是基于公開的資料,人臉 ID 數在 1 萬的量級左右。但 Google 的網際網路資料非常多,它做得最大的實驗用到了兩億六千萬的人臉資料,總 ID 數大概在 800 萬左右。是以在那個時候,Google 從一開始就用了 Triplet Loss,意思就是它有三個樣本的對,其中有一個叫 Anchor一個叫 Negative,一個叫Positive。Positive 的意思就是它跟 Anchor 是同一類的,如果跟 Anchor 不是同一類就是 Negative。 FaceNet采用的訓練集是MS-Celeb-1M資料集,它是微軟一個非常大的人臉識别資料庫,每個人大約有100張人臉圖檔,這個預訓練模型的準确率已經達到0.993±0.004。 因為FaceNet 使用的是谷歌的“inception resnet v1”網絡模型,這個模型的輸入時160160的圖像,而我們下載下傳的LFW資料集是250250限像素的圖像,是以需要進行圖檔的預處理。

LFW (Labeled Faces in the Wild) 人臉資料庫是由美國馬薩諸塞州立大學阿默斯特分校計算機視覺實驗室整理完成的資料庫,主要用來研究非受限情況下的人臉識别問題。LFW 資料庫主要是從網際網路上搜集圖像,而不是實驗室,一共含有13233 多張人臉圖像,共5749人,其中4096人隻有一張圖檔,有1680 人對應不隻一張圖像,每張圖像都被辨別出對應的人的名字。
用于評測人臉識别算法效果的公開評測資料集為 LFW【1】,全稱帶标簽的自然人臉資料庫(Labeled Faces in the Wild),由美國馬薩諸塞州大學艾姆赫斯特學院建立,完整的帶标簽自然人臉資料庫可以作為一個壓縮包(lfw.tgz)下載下傳。每張圖檔命名方式為 “lfw/name/name_xxxx.jpg”, 這裡“xxxx”是前面補零的四位圖檔編号。例如,前美國總統 喬治•W•布什 的第10張圖檔為 “lfw/George_W_Bush/George_W_Bush_0010.jpg”。
           

LFW 總共有 13233 張 JPEG 格式圖檔,屬于 5749 個不同人。每張圖檔尺寸都是 250x250。LFW 是學術界進行人臉驗證性能評測的事實上的标準測試資料集。

這個集合被廣泛應用于評價 face verification算法的性能。

傳統算法方面,結果最好的是GaussianFace。

Chaochao Lu and Xiaoou Tang. Surpassing Human-Level Face Verification Performance on LFW with GaussianFace.

當然,更好的結果是基于deep learning,結果雖然好,但是運算代價比較高。優點是實作簡單,opensource 比較多。

和人臉相關的任務有多種:

人臉檢測(将圖檔中包含的人臉進行初步定位,以及關鍵點如眼睛、鼻子、嘴巴等更精細的定位,文章封面即為典型人臉檢測結果)

人臉跟蹤(視訊中跟蹤人臉位置變化)

人臉驗證(輸入兩張人臉,判定是否屬于同一人)

人臉識别(輸入一張人臉,判斷其屬于人臉資料庫全部記錄中具體哪一人)

人臉聚類(輸入一批人臉,将屬于同一人的自動歸為一類)

繼續閱讀