天天看點

文獻閱讀——Unsupervised Feature Learning for 3D Scene Labeling

機器人自動化領域頂級會議ICRA 2014上的一篇關于Kinect點雲标注的文章。文章要解決的問題依然是目前帶有人工标注資訊的3D點雲訓練集的匮乏。就标注算法架構而言,本文無太大新意,采用的依然是常見的MRF模型。與之前所看到的關于點雲标注的文章不同之處在于,本文作者提取了RGBD圖像上的特征和3D點雲特征。之是以文章标題帶有“Unsupervised Feature Learning”字眼,主要是因為本文的特征學習采用的是sparse coding算法。本文引用了HMP3D,一種分層的sparse coding 算法,學習點雲特征。特征學習的架構為sparse coding+CNN,感興趣的話可以看下Andrew Ng近幾年發的一些論文。

本文學習特征時所用的3D資料來自網上的線上3D models,如google warehouse 3d model,主要為感興趣物體的CAD模型。HMP3D技術同不少文章中用到的sparse coding方法類似。在第一層,先以小的尺度提取塊特征,此時用到的特征為底層特征(如法向量、顔色資訊等),學習到M個單詞的字典,然後再coding每個塊得到M長的特征向量,為增強特征的判别性,用3D spatial pyramid max pooling提取3個level 的特征并作L2歸一化;在第二層,做法類似第一層,但是以更大的尺度提取塊特征,此時用到的特征為中層特征,即每個塊關于第一層字典的sparse codes,然後再學習字典,再coding,用3D spatial pyramid max pooling提取3個level 的特征并作L2歸一化。最後将兩側特征串在一起形成整個物體的3D特征。

繼續閱讀