轉載請注明作者和出處： http://blog.csdn.net/john_bh/

文章目錄

一. 人臉資料彙總表
- 1.人臉檢測
- 2.人臉關鍵點檢測
- 3.人臉表情
- 4.年齡與性别
- 5.人臉姿态
- 6.人臉識别
二. 常用人臉資料詳細介紹
- 1.人臉檢測
- 2.人臉關鍵點檢測
- - 2.1 CMU Multi-PIE
  - 2.2 LFPW
  - 2.3 AFLW
  - 2.4 Helen
  - 2.5 COFW
  - 2.6 300W
  - 2.7 WFLW
- 3.人臉表情
- 4.年齡與性别
- 5.人臉姿态
- 6.人臉識别

人臉資料集續更新完善中~~~

一. 人臉資料彙總表

1.人臉檢測

人臉檢測是要定位出圖像中人臉的位置。

DataSet	時間	相關paper	描述
Caltech 10000	2007	這是一個灰階人臉資料集，使用Google圖檔搜尋引擎用關鍵詞爬取所得，包含了7,092張圖，10,524個人臉，平均分辨率在304x312，除此之外還提供雙眼，鼻子和嘴巴共4個坐标位置。在早期被使用的較多，現在的方法已經很少用灰階資料集做評測。	連結
FDDB	2010	這是被廣泛用于人臉檢測方法評測的一個資料集，FDDB（Face Detection Data Set and Benchmark），它的提出是用于研究無限制人臉檢測。所謂無限制指的是人臉表情、尺度、姿态、外觀等具有較大的可變性。FDDB的圖檔都來自于 Faces in the Wild 資料集，圖檔來源于美聯社和路透社的新聞報道圖檔，是以大部分都是名人，而且是自然環境下拍攝的。共2845張圖檔，裡面有5171張人臉圖像。在FDDB當中采用了橢圓标記法，它可以适應人臉的輪廓。具體來說，每個标注的橢圓形人臉由六個元素組成。(ra, rb, Θ, cx, cy, s)，其中ra，rb是橢圓的半長軸、半短軸，cx, cy是橢圓的中心點坐标，Θ是長軸與水準軸夾角（頭往左偏Θ為正，頭往右偏Θ為負），s則是置信度得分。标注的結果是通過多人獨立完成标注之後取标注的平均值，而且排除了以下的樣本：長或寬小于20個像素的人臉區域；設定一個門檻值，将像素低于門檻值的區域标記為非人臉；遠離相機的人臉區域被标記為非人臉；人臉被遮擋，2個眼睛都不在區域内的标記為非人臉。	連結
AFW	2013	AFW資料集是人臉關鍵點檢測非常早期使用的資料集，共包含205個圖像，其中有473個标記的人臉。每一個人臉提供了方形邊界框，6個關鍵點和3個姿勢角度的标注。
WIDER Face	2015	FDDB評測标準由于隻有幾千張圖像，這樣的資料集在人臉的姿态、尺度、表情、遮擋和背景等多樣性上非常有限，訓練出來的模型難以被很好的評判，算法很快就達到飽和。在這樣的背景下香港中文大學提出了Wider-face資料集，在很長一段時間裡，大型網際網路公司和科研機構都在Wider-face上做人臉檢測算法競賽。Wider-face總共有32203張圖檔，共有393703張人臉,比FDDB資料集大10倍，而且在面部的尺寸、姿勢、遮擋、表情、妝容、光照上都有很大的變化，算法不僅标注了框，還提供了遮擋和姿态的資訊，自釋出後廣泛應用于評估性能比傳統方法更強大的卷積神經網絡。	連結
MALF	2015	Multi-Attribute Labelled Faces ，MALF是為了更加細粒度地評估野外環境中人臉檢測模型而設計的資料庫。資料主要來源于Internet，包含5250個圖像，11931個人臉。每一幅圖像包含正方形邊界框，頭部姿态的俯仰程度，包括小中大三個等級的标注。該資料集忽略了小于20*20或者非常難以檢測的人臉，共包含大約838個人臉，占該資料集的7%。同時該資料集還提供了性别，是否帶眼鏡，是否遮擋，是否是誇張的表情等輔助資訊	連結

2.人臉關鍵點檢測

DataSet	時間	相關paper	标注	描述	場景
AR Face Database	1998	22	包括126個人，超過4000張圖。	連結
XM2VTS	1999	68	包含295個人，2360張正面圖，大部分的圖像是無表情，而且在同樣的光照環境下。	連結
FRGC-V2	2002	5	共466個人的4950張圖，包括均勻的光照條件下的高品質圖和不均勻的光照條件下的低品質圖，标注了5個關鍵點。	連結
CMU Multi-PIE	2010	39~68	包含6152張圖像	連結
LFPW	CVPR2011	Localizing Parts of Faces Using a Consensus of Exemplars	29	1432張圖檔，每張圖檔上有29個點。	連結
AFLW	ECCV 2011	Annotated Facial Landmarks in the Wild: A Large-scale, Real-world Database	21	包括多姿态、多視角的大規模人臉資料庫，一般用于評估面部關鍵點檢測效果，圖檔來自于flickr的爬取。總共有21,997張圖，25,993張面孔，由于是肉眼标記，不可見的關鍵點不進行标注。除了關鍵點之外，還提供了矩形框和橢圓框的臉部位還提供了矩形框和橢圓框的臉部位置标注，其中橢圓框的标注方法與FDDB相同。另外還有從平均3D人臉重建提供的3D的人臉姿态角标注。大部分圖像是彩色圖，也有少部分是灰階圖，59%為女性，41%為男性，這個資料集非常适合做多角度多人臉檢測，關鍵點定位和頭部姿态估計，是關鍵點檢測領域裡非常重要的一個資料集。	連結
Helen	ECCV2012	Interactive Facial Feature Localization	68	包括訓練集和測試集，測試集包含了330張人臉圖檔，訓練集包括了2000張人臉圖檔	連結
IBUG	2013	68	随着300W一起釋出的資料集，包含了135張人臉圖檔，每張人臉圖檔被标注了68個特征點。	連結
AFW（Annotated Faces in the Wild）	CVPR2012	Face detection, pose estimation and landmark localization in the wild	6	AFW資料集是人臉關鍵點檢測非常早期使用的資料集，共包含205個圖像，其中有473個标記的人臉。每一個人臉提供了方形邊界框，6個關鍵點和3個姿勢角度的标注，資料庫雖然不大，額外的好處是作者給出了其2012 CVPR的論文和程式以及訓練好的模型。	連結
COFW	ICCV2013	Robust face landmark estimation under occlusion	29	遮擋圖像較多，包括1852張圖像,其中訓練姐1345張圖像，測試集507張圖像	連結
300W	ICCV2013	300 Faces in-the-Wild Challenge: The first facial landmark localization Challenge	68	包含了300張室内圖和300張室外圖，其中資料集内部的表情，光照條件，姿态，遮擋，臉部大小變化非常大，因為是通過Google搜尋“party”, “conference”等較難等場景搜集而來。該資料集标注了68個關鍵點，一定程度上在這個資料集能取得好結果的，在其他資料集也能取得好結果。該資料集每個圖像上包含不止一張人臉，但是對于每張圖像隻标注一張人臉。其中：AFW(337)，Helen(train 2000+test 330)，IBUG(135)，LFPW(train 811+test 224)。共計3148張圖像，測試集有554+135=689張圖像。	連結
300-W challenge	ICCV2013	300 Faces in-the-Wild Challenge: The first facial landmark localization Challenge	68	300-W challenge所使用的訓練資料集實際上并不是一個全新的資料集，它是采用了半監督的标注工具，将AFLW，AFW，Helen，IBUG，LFPW，FRGC-V2，XM2VTS等資料集進行了統一标注然後得到的，關鍵資訊是68個點	連結
300-VW	ICCV2015	68	在ICCV2015年拓展成了視訊标注，即300 Videos in the Wild (300-VW)	連結
MTFL/MAFL	2014	68	這裡包含了兩個資料集。Multi-Task Facial Landmark (MTFL) 資料集包含了12,995 張臉，5個關鍵點标注，另外也提供了性别，是否微笑，是否佩戴眼鏡以及頭部姿态的資訊。Multi-Attribute Facial Landmark (MAFL) 資料集則包含了20,000張臉，5個關鍵點标注與40個面部屬性，實際上後面被包含在了Celeba資料集中，該資料集我們後面會進行介紹。這兩個資料集都使用TCDCN方法将其拓展到了68個關鍵點的标注	連結
SCUT-FBP	2017	86	資料集共5500個正面人臉，年齡分布為15-60，全部都是自然表情。包含不同的性别分布和種族分布（2000亞洲女性，2000亞洲男性，750高加索男性，750高加索女性），資料分别來自于資料堂，US Adult database等。每一張圖由60個人進行評分，共評為5個等級，這60個人的年齡分布為18～27歲，均為年輕人。适用于基于apperance/shape等的模型研究。	連結
WFLW	ECCV2018	Look at Boundary: A Boundary-Aware Face Alignment Algorithm	98	共10k 圖像，其中7500訓練集，2500測試集，标注資訊除了98個關鍵點之外，還有遮擋，姿态，妝容，光照，模糊和表情等資訊的标注。	連結 ----論文開源code

3.人臉表情

人臉表情識别(facial expression recognition, FER)是人臉屬性識别技術中的一個重要組成部分，在人機互動、安全控制、直播娛樂、自動駕駛等領域都非常具有應用價值

DataSet	時間	相關paper	描述
JAFFE	1998	這是比較小和老的資料庫。該資料庫是由10位日本女性在實驗環境下根據訓示做出各種表情，再由照相機拍攝擷取的人臉表情圖像。整個資料庫一共有213張圖像，10個人，全部都是女性，每個人做出7種表情，這7種表情分别是：sad, happy, angry, disgust, surprise, fear, neutral，每組大概20張樣圖。	連結
KDEF與AKDEF	1998	這個資料集最初是被開發用于心理和醫學研究目的。它主要用于知覺，注意，情緒，記憶等實驗。在建立資料集的過程中，特意使用比較均勻，柔和的光照，被采集者身穿統一的T恤顔色。這個資料集，包含70個人，35個男性，35個女性，年齡在20至30歲之間。沒有胡須，耳環或眼鏡，且沒有明顯的化妝。7種不同的表情，每個表情有5個角度。總共4900張彩色圖，尺寸為562*762像素。	連結
GENKI	2009	GENKI資料集是由加利福尼亞大學的機器概念實驗室收集。該資料集包含GENKI-R2009a，GENKI-4K，GENKI-SZSL三個部分。GENKI-R2009a包含11159個圖像，GENKI-4K包含4000個圖像，分為“笑”和“不笑”兩種，每個圖檔擁有不同的尺度大小，姿勢，光照變化，頭部姿态，可專門用于做笑臉識别。這些圖像包括廣泛的背景，光照條件，地理位置，個人身份和種族等。	連結
RaFD	2010	該資料集是Radboud大學Nijmegen行為科學研究所整理的，這是一個高品質的臉部資料庫，總共包含67個模特，其中20名白人男性成年人，19名白人女性成年人，4個白人男孩，6個白人女孩，18名摩洛哥男性成年人。總共8040張圖，包含8種表情，即憤怒，厭惡，恐懼，快樂，悲傷，驚奇，蔑視和中立。每一個表情，包含3個不同的注視方向，且使用5個相機從不同的角度同時拍攝的。	連結
CK	2010	這個資料庫是在Cohn-Kanade Dataset的基礎上擴充來的，它包含137個人的不同人臉表情視訊幀。這個資料庫比起JAFFE要大的多。而且也可以免費擷取，包含表情的标注和基本動作單元的标注。	連結
Fer2013	2013	該資料集包含共26190張48*48灰階圖，圖檔的分辨率比較低，共6種表情。分别為0 anger生氣、1 disgust 厭惡、2 fear 恐懼、3 happy 開心、4 sad 傷心、5 surprised 驚訝、6 normal 中性。	連結
RAF	2017	包含總共29672 張圖檔，其中7個基本表情和12 個複合表情，而且每張圖還提供了5個精确的人臉關鍵點，年齡範圍和性别标注。	連結
EmotionNet	2017	共950,000張圖，其中包含基本表情，複合表情，以及表情單元的标注。	連結

表情識别目前的關注點已經從實驗室環境下轉移到具有挑戰性的真實場景條件下，研究者們開始利用深度學習技術來解決如光照變化、遮擋、非正面頭部姿勢等問題，仍然有很多的問題需要解決。

另一方面，盡管目前表情識别技術被廣泛研究，但是我們所定義的表情隻涵蓋了特定種類的一小部分，尤其是面部表情，而實際上人類還有很多其他的表情。表情的研究相對于顔值年齡等要難得多，應用也要廣泛的多，相信這幾年會不斷出現有意思的應用。

4.年齡與性别

人臉的年齡和性别識别在安全控制，人機互動領域有着非常廣泛的使用，而且由于人臉差異性，人臉的年齡估計仍然是一個難點。

DataSet	時間	相關paper	描述
FGNet	2000	第一個意義重大的年齡資料集，包含了82個人的1002張圖，年齡範圍是0到69歲。	連結
CACD2000	2013	這是一個名人資料集，包含了2,000個人的163446張名人圖檔，其範圍是16到62歲。	連結
Adience	2014	采用iPhone5或更新的智能手機拍攝的資料，共2284個人26580張圖像。它的标注采用的是年齡段的形式而不是具體的年齡，其中年齡段為（0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60+）	連結
IMDB-wiki	2015	IMDB-WIKI人臉資料庫是由IMDB資料庫和Wikipedia資料庫組成，其中IMDB人臉資料庫包含了460,723張人臉圖檔，而Wikipedia人臉資料庫包含了62,328張人臉資料庫，總共523,051張人臉資料。都是從IMDb和維基百科上爬取的名人圖檔，根據照片拍攝時間戳和出生日期計算得到的年齡資訊，以及性别資訊，對于年齡識别和性别識别的研究有着重要的意義，這是目前年齡和性别識别最大的資料集。	連結
MORPH	2017	包括13,000多個人的55,000張圖，年齡範圍是16到77	連結

5.人臉姿态

人臉的姿态估計在考勤，支付以及各類社交應用中有非常廣泛的應用。

DataSet	描述	場景	連結

6.人臉識别

DataSet	描述	場景	連結

二. 常用人臉資料詳細介紹

1.人臉檢測

2.人臉關鍵點檢測

2.1 CMU Multi-PIE

為了系統地捕捉具有不同姿勢和照明的圖像，我們使用了一個由15個攝像頭和18個閃光燈連接配接到一組Linux pc上的系統。13個攝像頭位于頭部高度，間隔15°，另外兩個攝像頭位于受試者上方，模拟典型的監控場景。下圖顯示了錄影機的位置。