四個動作識别資料集的簡介

2023-05-07 18:41:38

1、UT-Interaction資料集

包含6類人與人互動的視訊：揮手，指向，擁抱，推，踢和用拳猛擊。總共有20個視訊序列的長度約為1分鐘。每個視訊每個互動至少包含一次執行，為每個視訊平均提供8次人類活動的執行。視訊中會出現多個有超過15種不同類型服飾的參與者。視訊采用720 * 480,30fps的分辨率拍攝，視訊中人物的高度約為200像素。

将視訊分成兩組。一組在停車場拍攝，由10個視訊序列組成。視訊采用稍微不同的縮放比例，其背景大部分是靜态的，而且相機抖動很小。第二組（即其他10個序列）在處于刮風天氣的草坪上拍攝。背景略有變動（例如樹移動），也包含更多的相機抖動。從序列1到4以及從11到13，場景中隻出現兩個互動人物。從序列5到8和從14到17，場景中都有互相作用的人和行人。在第9,10,18,19和20組中，幾對互相作用的人同時執行這些活動。每組具有不同的背景，拍攝比例和照明情況。

2、CAVIAR Test Case Scenarios CAVIAR測試用例場景

拍攝多種情況下的情景，視訊内容包括人們獨自行走，與他人見面，購物，進出店鋪，打架、昏厥和在公共場所留下一個包裹。

第一部分視訊剪輯是在實驗室入口大廳用廣角相機鏡頭拍攝的。大多數剪輯從一個成員以身體和手勢示意場景的開始。

第二組資料在購物中心和沿着走廊使用廣角鏡頭拍攝。對于每個序列，從兩個不同的角度進行記錄，都有兩個時間同步的視訊，其中一個視角沿着走廊，另一個視角橫跨走廊的正面。

分辨率是PAL制式的一半分辨率（384 x 288像素，每秒25幀）并使用MPEG2進行壓縮。檔案大小主要在6到12 MB之間，有幾個高達21 MB。

3、BEHAVE Interactions Test Case Scenarios互動測試用例場景

資料集包含兩種不同視角下人們進行各種互動的場景，包括十個基本情景。視訊以每秒25幀的速度拍攝。分辨率是640x480。資料以AVI或一組JPEG圖像的檔案形式提供。

引用形式： S. J. Blunsden, R. B. Fisher, “The BEHAVE video dataset: ground truthed video for multi-person behavior classification” , Annals of the BMVA, Vol 2010(4), pp 1-12.

4、UCF101

UCF101是從YouTube收集的具有101個動作類别的真實動作視訊的動作識别資料集。該資料集是UCF50資料集的擴充，其中包含50個操作類别。

從101個動作類别的13320個視訊中，UCF101在動作方面提供了最大的多樣性，并且相機運動，物體外觀和姿态，物體比例，視點，背景混亂，照明條件等方面存在較大差異，它是最具有挑戰性的資料集迄今。由于大多數可用的行動識别資料集不現實并由行動者進行示範，是以UCF101旨在鼓勵通過學習和探索新的實際行動類别來進一步研究行動識别。

101個動作類别中的視訊被分組為25個組，其中每個組可以包含4-7個動作視訊。來自同一組的視訊可以共享一些共同的特征，諸如相似的背景，類似的觀點等等。

動作類别可以分為五種類型：1）人 - 物體互動2）身體動作3）人與人之間的互動4）演奏樂器5）運動。

四個動作識别資料集的簡介

繼續閱讀

如何使用前景和背景建立更清晰的照片

在Ubuntu16.04上提取相鄰序列圖像之間的ORB的特征點，并用暴力方法找到比對點并連線一、什麼是ORB特征二、什麼是暴力比對三、實作代碼四、運作方法

基于改進FCOS的鋼帶表面缺陷檢測

Matlab中将二維灰階圖像三維顯示

車道線檢測資料集

車道線檢測

自監督｜「CoCLR」視訊自監督對比學習筆記

資料集 | 網絡釣魚網站資料集

資料集 | 金融反欺詐資料集

資料集 | 2021東京奧運會獎牌榜資料集

視訊對象分割（Video Object Segmentation）研究小記任務定義與資料集技術路線分類基于神經網絡的模型總結

opencv視覺跟蹤——消除背景模組化

圖形處理單元(GPU)的演進

2021-09-30三維點雲測量正方形包裹體積

DOG算子

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡