人臉識別常用開源數(shù)據(jù)集大全

極市導(dǎo)讀
?本文總結(jié)整理了10個開源的人臉識別數(shù)據(jù)集,并附有相關(guān)下載鏈接,希望能給大家?guī)硪恍椭?>>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿
1.哥倫比亞大學(xué)公眾人物臉部數(shù)據(jù)庫
數(shù)據(jù)集鏈接:http://m6z.cn/5DlIR9
PubFig Dataset 是一個大型人臉數(shù)據(jù)集,主要用于人臉識別和身份鑒定,其涵蓋互聯(lián)網(wǎng)上 200 人的 58,797 張圖像,不同于大多數(shù)現(xiàn)有面部數(shù)據(jù)集,這些圖像是在主體完全不受控制的情況下拍攝的,因此不同圖像中姿勢、光照、表情、場景、相機、成像條件和參數(shù)存在較大差異,該數(shù)據(jù)集類似于 UMass-Amherst 創(chuàng)建的 LFW 數(shù)據(jù)集。
該數(shù)據(jù)集由哥倫比亞大學(xué)于 2009 年發(fā)布,相關(guān)論文有《Attribute and Simile Classifiers for Face Verification》。

2.CelebA人臉數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/60EW0n
CelebFaces Attributes Dataset (CelebA) 是一個大規(guī)模的人臉屬性數(shù)據(jù)集,包含超過 20 萬張名人圖像,每張都有 40 個屬性注釋。該數(shù)據(jù)集中的圖像涵蓋了較大的姿勢變化和雜亂的背景。CelebA 種類多、數(shù)量多、注釋豐富,包括10,177 個身份,202,599 張人臉圖像,以及5 個地標(biāo)位置,每張圖像 40 個二進制屬性注釋。
該數(shù)據(jù)集可用作以下計算機視覺任務(wù)的訓(xùn)練和測試集:人臉屬性識別、人臉識別、人臉檢測、地標(biāo)(或人臉部分)定位以及人臉編輯與合成。

3.美國國防部人臉庫
數(shù)據(jù)集鏈接:http://m6z.cn/5So6DB
為促進人臉識別算法的研究和實用化,美國國防部的Counterdrug Technology Transfer Program(CTTP)發(fā)起了一個人臉識別技術(shù)(Face Recognition Technology 簡稱FERET)工程,它包括了一個通用人臉庫以及通用測試標(biāo)準(zhǔn)。到1997年,它已經(jīng)包含了1000多人的10000多張照片,每個人包括了不同表情,光照,姿態(tài)和年齡的照片。

4.MTFL人臉識別數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6fHmaT
該數(shù)據(jù)集包含 12,995 張人臉圖像,這些圖像用 (1) 五個面部標(biāo)志,(2) 性別、微笑、戴眼鏡和頭部姿勢的屬性進行了注釋。

5.BioID人臉數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5ZUjyC
這個數(shù)據(jù)集包含了1521幅分辨率為384x286像素的灰度圖像。每一幅圖像來自于23個不同的測試人員的正面角度的人臉。為了便于做比較,這個數(shù)據(jù)集也包含了對人臉圖像對應(yīng)的手工標(biāo)注的人眼位置文件。圖像以 "BioID_xxxx.pgm"的格式命名,其中xxxx代表當(dāng)前圖像的索引(從0開始)。類似的,形如"BioID_xxxx.eye"的文件包含了對應(yīng)圖像中眼睛的位置。

6.PersonID人臉識別數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5So6vR
該數(shù)據(jù)集所選用的人臉照片均來自于兩部比較知名的電視劇,《吸血鬼獵人巴菲》和《生活大爆炸》。

7.CMU PIE人臉庫
數(shù)據(jù)集鏈接:http://m6z.cn/5vPwfO
CMU PIE人臉庫建立于2000年11月,它包括來自68個人的40000張照片,其中包括了每個人的13種姿態(tài)條件,43種光照條件和4種表情下的照片,現(xiàn)有的多姿態(tài)人臉識別的文獻基本上都是在CMU PIE人臉庫上測試的。

8.Youtube視頻人臉數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6u3P2V
該數(shù)據(jù)集包含 1,595 個不同人的 3,425 個視頻。所有視頻都是從 YouTube 下載的。每個主題平均有 2.15 個視頻可用。最短剪輯時長為 48 幀,最長剪輯為 6070 幀,視頻剪輯的平均長度為 181.3 幀。在這個數(shù)據(jù)集下,算法需要判斷兩段視頻里面是不是同一個人。有不少在照片上有效的方法,在視頻上未必有效/高效。
9.CASIA 人臉圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5vPwio
CASIA 人臉圖像數(shù)據(jù)庫版本 5.0(或 CASIA-FaceV5)包含 500 個對象的 2,500 個彩色人臉圖像。CASIA-FaceV5 的面部圖像是使用羅技 USB 攝像頭在一個會話中捕獲的。CASIA-FaceV5的志愿者包括研究生、工人、服務(wù)員等。所有人臉圖像均為16位彩色BMP文件,圖像分辨率為640*480。典型的類內(nèi)變化包括照明、姿勢、表情、眼鏡、成像距離等。

10.Caltech人臉數(shù)據(jù)庫
數(shù)據(jù)集鏈接:http://m6z.cn/5So6VP
該數(shù)據(jù)集包含通過在谷歌圖片搜索中輸入常見的名字從網(wǎng)絡(luò)上收集的人的圖像。每個正面的眼睛、鼻子和嘴巴中心的坐標(biāo)在地面實況文件中提供。此信息可用于對齊和裁剪人臉或作為人臉檢測算法的基本事實。該數(shù)據(jù)集有 10,524 個不同分辨率和不同設(shè)置的人臉,例如 肖像圖像、人群等。側(cè)面或非常低分辨率的面孔未標(biāo)記。

公眾號后臺回復(fù)“數(shù)據(jù)集”獲取30+深度學(xué)習(xí)數(shù)據(jù)集下載~

#?CV技術(shù)社群邀請函?#

備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測-深圳)
即可申請加入極市目標(biāo)檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

