天天看點

四個動作識别資料集的簡介

1、UT-Interaction資料集

包含6類人與人互動的視訊:揮手,指向,擁抱,推,踢和用拳猛擊。總共有20個視訊序列的長度約為1分鐘。每個視訊每個互動至少包含一次執行,為每個視訊平均提供8次人類活動的執行。視訊中會出現多個有超過15種不同類型服飾的參與者。視訊采用720 * 480,30fps的分辨率拍攝,視訊中人物的高度約為200像素。

将視訊分成兩組。一組在停車場拍攝,由10個視訊序列組成。視訊采用稍微不同的縮放比例,其背景大部分是靜态的,而且相機抖動很小。第二組(即其他10個序列)在處于刮風天氣的草坪上拍攝。背景略有變動(例如樹移動),也包含更多的相機抖動。從序列1到4以及從11到13,場景中隻出現兩個互動人物。從序列5到8和從14到17,場景中都有互相作用的人和行人。在第9,10,18,19和20組中,幾對互相作用的人同時執行這些活動。每組具有不同的背景,拍攝比例和照明情況。

2、CAVIAR Test Case Scenarios CAVIAR測試用例場景

拍攝多種情況下的情景,視訊内容包括人們獨自行走,與他人見面,購物,進出店鋪,打架、昏厥和在公共場所留下一個包裹。

第一部分視訊剪輯是在實驗室入口大廳用廣角相機鏡頭拍攝的。大多數剪輯從一個成員以身體和手勢示意場景的開始。

第二組資料在購物中心和沿着走廊使用廣角鏡頭拍攝。對于每個序列,從兩個不同的角度進行記錄,都有兩個時間同步的視訊,其中一個視角沿着走廊,另一個視角橫跨走廊的正面。

分辨率是PAL制式的一半分辨率(384 x 288像素,每秒25幀)并使用MPEG2進行壓縮。 檔案大小主要在6到12 MB之間,有幾個高達21 MB。

3、BEHAVE Interactions Test Case Scenarios互動測試用例場景

資料集包含兩種不同視角下人們進行各種互動的場景,包括十個基本情景。視訊以每秒25幀的速度拍攝。 分辨率是640x480。資料以AVI或一組JPEG圖像的檔案形式提供。

引用形式: S. J. Blunsden, R. B. Fisher, “The BEHAVE video dataset: ground truthed video for multi-person behavior classification” , Annals of the BMVA, Vol 2010(4), pp 1-12.

4、UCF101

UCF101是從YouTube收集的具有101個動作類别的真實動作視訊的動作識别資料集。該資料集是UCF50資料集的擴充,其中包含50個操作類别。

從101個動作類别的13320個視訊中,UCF101在動作方面提供了最大的多樣性,并且相機運動,物體外觀和姿态,物體比例,視點,背景混亂,照明條件等方面存在較大差異,它是最具有挑戰性的資料集迄今。由于大多數可用的行動識别資料集不現實并由行動者進行示範,是以UCF101旨在鼓勵通過學習和探索新的實際行動類别來進一步研究行動識别。

101個動作類别中的視訊被分組為25個組,其中每個組可以包含4-7個動作視訊。來自同一組的視訊可以共享一些共同的特征,諸如相似的背景,類似的觀點等等。

動作類别可以分為五種類型:1)人 - 物體互動2)身體動作3)人與人之間的互動4)演奏樂器5)運動。

繼續閱讀