天天看點

人臉識别常用開源資料集大全

作者:極市平台

1.哥倫比亞大學公衆人物臉部資料庫

資料集連結:http://m6z.cn/5DlIR9

PubFig Dataset 是一個大型人臉資料集,主要用于人臉識别和身份鑒定,其涵蓋網際網路上 200 人的 58,797 張圖像,不同于大多數現有面部資料集,這些圖像是在主體完全不受控制的情況下拍攝的,是以不同圖像中姿勢、光照、表情、場景、相機、成像條件和參數存在較大差異,該資料集類似于 UMass-Amherst 建立的 LFW 資料集。

該資料集由哥倫比亞大學于 2009 年釋出,相關論文有《Attribute and Simile Classifiers for Face Verification》。

人臉識别常用開源資料集大全

2.CelebA人臉資料集

資料集連結:http://m6z.cn/60EW0n

CelebFaces Attributes Dataset (CelebA) 是一個大規模的人臉屬性資料集,包含超過 20 萬張名人圖像,每張都有 40 個屬性注釋。該資料集中的圖像涵蓋了較大的姿勢變化和雜亂的背景。CelebA 種類多、數量多、注釋豐富,包括10,177 個身份,202,599 張人臉圖像,以及5 個地标位置,每張圖像 40 個二進制屬性注釋。

該資料集可用作以下計算機視覺任務的訓練和測試集:人臉屬性識别、人臉識别、人臉檢測、地标(或人臉部分)定位以及人臉編輯與合成。

人臉識别常用開源資料集大全

3.美國國防部人臉庫

資料集連結:http://m6z.cn/5So6DB

為促進人臉識别算法的研究和實用化,美國國防部的Counterdrug Technology Transfer Program(CTTP)發起了一個人臉識别技術(Face Recognition Technology 簡稱FERET)工程,它包括了一個通用人臉庫以及通用測試标準。到1997年,它已經包含了1000多人的10000多張照片,每個人包括了不同表情,光照,姿态和年齡的照片。

人臉識别常用開源資料集大全

4.MTFL人臉識别資料集

資料集連結:http://m6z.cn/6fHmaT

該資料集包含 12,995 張人臉圖像,這些圖像用 (1) 五個面部标志,(2) 性别、微笑、戴眼鏡和頭部姿勢的屬性進行了注釋。

人臉識别常用開源資料集大全

5.BioID人臉資料集

資料集連結:http://m6z.cn/5ZUjyC

這個資料集包含了1521幅分辨率為384x286像素的灰階圖像。每一幅圖像來自于23個不同的測試人員的正面角度的人臉。為了便于做比較,這個資料集也包含了對人臉圖像對應的手工标注的人眼位置檔案。圖像以 "BioID_xxxx.pgm"的格式命名,其中xxxx代表目前圖像的索引(從0開始)。類似的,形如"BioID_xxxx.eye"的檔案包含了對應圖像中眼睛的位置。

人臉識别常用開源資料集大全

6.PersonID人臉識别資料集

資料集連結:http://m6z.cn/5So6vR

該資料集所選用的人臉照片均來自于兩部比較知名的電視劇,《吸血鬼獵人巴菲》和《生活大爆炸》。

人臉識别常用開源資料集大全

7.CMU PIE人臉庫

資料集連結:http://m6z.cn/5vPwfO

CMU PIE人臉庫建立于2000年11月,它包括來自68個人的40000張照片,其中包括了每個人的13種姿态條件,43種光照條件和4種表情下的照片,現有的多姿态人臉識别的文獻基本上都是在CMU PIE人臉庫上測試的。

人臉識别常用開源資料集大全

8.Youtube視訊人臉資料集

資料集連結:http://m6z.cn/6u3P2V

該資料集包含 1,595 個不同人的 3,425 個視訊。所有視訊都是從 YouTube 下載下傳的。每個主題平均有 2.15 個視訊可用。最短剪輯時長為 48 幀,最長剪輯為 6070 幀,視訊剪輯的平均長度為 181.3 幀。在這個資料集下,算法需要判斷兩段視訊裡面是不是同一個人。有不少在照片上有效的方法,在視訊上未必有效/高效。

人臉識别常用開源資料集大全

9.CASIA 人臉圖像資料集

資料集連結:http://m6z.cn/5vPwio

CASIA 人臉圖像資料庫版本 5.0(或 CASIA-FaceV5)包含 500 個對象的 2,500 個彩色人臉圖像。CASIA-FaceV5 的面部圖像是使用羅技 USB 攝像頭在一個會話中捕獲的。CASIA-FaceV5的志願者包括研究所學生、勞工、服務員等。所有人臉圖像均為16位彩色BMP檔案,圖像分辨率為640*480。典型的類内變化包括照明、姿勢、表情、眼鏡、成像距離等。

人臉識别常用開源資料集大全

10.Caltech人臉資料庫

資料集連結:http://m6z.cn/5So6VP

該資料集包含通過在谷歌圖檔搜尋中輸入常見的名字從網絡上收集的人的圖像。每個正面的眼睛、鼻子和嘴巴中心的坐标在地面實況檔案中提供。此資訊可用于對齊和裁剪人臉或作為人臉檢測算法的基本事實。該資料集有 10,524 個不同分辨率和不同設定的人臉,例如 肖像圖像、人群等。側面或非常低分辨率的面孔未标記。

人臉識别常用開源資料集大全