天天看點

開源架構PointNet 資料集結構——語義分割部分

要訓練自己的資料,需要把自己的資料集做成PontNet所用資料集相似的結構。故記錄本文以備忘

1. 論文中的描述

pointnet 應用分為三部分:點雲分類(3D Object Classification),點雲部分分割(3D Object Part Segmentation),語義分割(Semantic Segmentation in Scenes)。本文隻解釋語義分割部分的資料集。

論文中用的是Stanford 3D semantic parsing data set 這一資料集。資料集中包含用Matterport scanner 中掃描的3D 室内對象,這些對象來自于6個區域的271個房間,每個點都加上了13個語義标簽(例如椅子,桌子,地闆,牆等)中的1個。

按照房間來劃分點集,然後将房間采樣為1m×1m的塊。對每個塊預測其中每個點的語義标簽。每個點由一個9-dim 向量表示,向量分量分别為:X, Y, Z, R, G, B,  normalized location as to the room (from 0 to 1)。訓練時,在每個塊中實時随機采樣4096個點。測試時用所有的點。用k-fold方法來訓練和測試。

2. 下載下傳資料集

終端運作: $ sh download_data.sh

下載下傳得到:indoor3d_sem_seg_hdf5_data 檔案夾,裡面由ply_data_all_0.h5 至ply_data_all_23.h5 共24個h5格式的資料檔案,每個裡面都有兩個dataset:data 和 label。這24個檔案共有23×1000+585=23585行,每行一個Block,每個Block有4096ge點,每點9個次元。

另外還有兩個txt檔案:all_files.txt 和 room_filelist.txt。前者儲存24個資料檔案名。後者有23585 行; 即對應每個Block是在哪個area的哪個room采集的

繼續閱讀