LFW人臉資料庫的簡介
LFW (Labled Faces in the Wild)人臉資料集:是目前人臉識别的常用測試集,其中提供的人臉圖檔均來源于生活中的自然場景,是以識别難度會增大,尤其由于多姿态、光照、表情、年齡、遮擋等因素影響導緻即使同一人的照片差别也很大。并且有些照片中可能不止一個人臉出現,對這些多人臉圖像僅選擇中心坐标的人臉作為目标,其他區域的視為背景幹擾。LFW資料集共有13233張人臉圖像,每張圖像均給出對應的人名,共有5749人,且絕大部分人僅有一張圖檔。每張圖檔的尺寸為250X250,絕大部分為彩色圖像,但也存在少許黑白人臉圖檔。
A database of face photographsdesigned for studying the problem of unconstrained face recognition.The data set contains more than 13,000 images of faces collected fromthe web. Each face has been labeled with the name of the personpictured. 1680 of the people pictured have two or more distinct photosin the data set. The only constraint on these faces is that they weredetected by the Viola-Jones face detector. More details can be foundin the technical report below. There are now four different sets of LFW images including the original and three different types of "aligned" images.The aligned images include "funneled images" (ICCV 2007), LFW-a, which uses an unpublished method of alignment,and "deep funneled" images (NIPS 2012). Among these, LFW-a and the deep funneled images produce superior results for most face verification algorithms over the original images and over the funneled images (ICCV 2007).
Labeled Faces in the Wild官網:
http://vis-www.cs.umass.edu/lfw/LFW (Labeled Faces in the Wild) 人臉資料庫是由美國馬薩諸塞州立大學阿默斯特分校計算機視覺實驗室整理完成的資料庫,主要用來研究非受限情況下的人臉識别問題。LFW 資料庫主要是從網際網路上搜集圖像,而不是實驗室,一共含有13000 多張人臉圖像,每張圖像都被辨別出對應的人的名字,其中有1680 人對應不隻一張圖像,即大約1680個人包含兩個以上的人臉。
LFW資料集主要測試人臉識别的準确率,該資料庫從中随機選擇了6000對人臉組成了人臉辨識圖檔對,其中3000對屬于同一個人2張人臉照片,3000對屬于不同的人每人1張人臉照片。測試過程LFW給出一對照片,詢問測試中的系統兩張照片是不是同一個人,系統給出“是”或“否”的答案。通過6000對人臉測試結果的系統答案與真實答案的比值可以得到人臉識别準确率。
這個集合被廣泛應用于評價 face verification算法的性能。
這些資料集唯一的限制就是它們可以被經典的Viola-Jones檢測器檢測到(a hummor)。圖像如下圖所示,

1、LFW資料集的重要意義
可以看出,在LFW 資料庫中人臉的光照條件、姿态多種多樣,有的人臉還存在部分遮擋的情況,是以識别難度較大。現在, LFW 資料庫性能測評已經成為人臉識别算法性能的一個重要名額。
LFW人臉資料庫的安裝
下載下傳連結:
http://vis-www.cs.umass.edu/lfw/index.html#downloadLFW人臉資料庫的使用方法
ML之SVM:調用(sklearn的lfw_people函數線上下載下傳55個外國人圖檔檔案夾資料集)來精确實作人臉識别并提取人臉特征向量