新發現編碼器PointPillars用于點雲檢測物體，更加高效且精準

原創 | 文 BFT機器人

技術背景

在過去的幾年中，深度學習技術已經在圖像領域的物體檢測中取得了顯著的進展，諸如目标檢測算法（如Faster R-CNN、YOLO和SSD）在圖像中能夠高效準确地檢測出物體。然而，當涉及到點雲資料（由雷射雷達等傳感器擷取的三維資料）時，物體檢測仍然面臨許多挑戰。

點雲資料與傳統的圖像資料不同，它們是由大量的離散點組成，每個點都包含了物體在三維空間中的位置資訊。是以，在點雲資料中進行物體檢測需要解決一些獨特的問題。例如，點雲資料的密度可能會因物體距離傳感器的遠近而變化，噪聲和遮擋也可能影響檢測結果。此外，點雲資料通常需要進行預處理，以便在深度學習模型中使用。

為了克服這些挑戰，該文提出了一種新的點雲資料編碼器，名為PointPillars。PointPillars可以實作端到端的訓練，進而直接從原始點雲資料中學習物體檢測任務。這種編碼器可以将點雲資料轉換為一種表示形式，使其适用于深度學習模型的輸入。PointPillars的設計考慮了點雲資料的稀疏性，以及在三維空間中的分布情況。

值得注意的是，該方法在KITTI挑戰賽中取得了最好的檢測性能。KITTI挑戰賽是一個關注自動駕駛領域的競賽，旨在評估不同算法在真實場景中檢測、定位和跟蹤車輛等物體的能力。是以，PointPillars 的成功表明了它在點雲資料中進行物體檢測方面的有效性和優越性。

論文創新點

本文的創新點是提出了一種新的編碼器，稱為PointPillars，它可以對點雲資料進行端到端的訓練，并且可以在隻使用雷射雷達資料的情況下實作比現有方法更高的檢測性能。PointPillars使用PointNets對點雲資料進行編碼，将點雲資料組織成垂直柱狀結構，然後使用2D卷積神經網絡進行檢測。與現有方法相比，PointPillars具有更快的運作速度和更高的檢測精度。此外，PointPillars不需要手動調整垂直方向的分箱，因為它是在柱狀結構上進行操作，而不是在體素上進行操作。

算法介紹

涉及本文中的算法部分，它主要分為兩個關鍵元件：編碼器和檢測器。

編碼器：編碼器利用PointNets對點雲資料進行處理，以建立一種垂直柱狀結構。具體而言，編碼器将點雲資料劃分為垂直方向的柱狀體素，每個體素包含一定數量的點。随後，PointNets被用于對每個柱狀體素進行編碼，産生一個固定長度的特征向量。這些特征向量被整合成一個矩陣，将其作為檢測器的輸入。

檢測器：檢測器利用2D卷積神經網絡對經編碼的點雲資料進行檢測。具體而言，檢測器采用了Single Shot Detector (SSD)架構進行物體檢測。SSD架構使用一組預定義的錨點框來感覺物體，每個錨點框代表特定的物體尺寸和寬高比。檢測器通過卷積神經網絡對每個錨點框進行分類和回歸，進而确定每個框是否包含物體，同時确定物體的位置和尺寸。

總體來看，PointPillars算法的主要優勢在于，它能夠僅利用雷射雷達資料實作比現有方法更出色的檢測性能。此外，該算法的執行速度更快，檢測精度更高。值得一提的是，PointPillars不需要手動調整垂直方向的箱體劃分，因為其操作是在柱狀結構上進行，而非體素級别上進行調整。這使得算法更加自适應。

實驗論述

本文的實驗部分主要使用了KITTI object detection benchmark dataset進行實驗。該資料集包含了雷射雷達點雲資料和圖像資料，用于物體檢測和跟蹤任務。本文隻使用雷射雷達點雲資料進行訓練和測試，并與使用雷射雷達和圖像資料的融合方法進行比較。

實驗設定：

本文使用Adam優化器對損失函數進行優化，初始學習率為2e-4，每15個epoch衰減0.8倍。訓練160個epoch，batch size為2，驗證集和測試集的batch size分别為4。為了進行實驗研究，本文将官方訓練集分為3712個訓練樣本和3769個驗證樣本，測試集包含784個樣本。本文使用訓練集進行模型訓練，使用驗證集進行模型選擇和調整，最終在測試集上進行評估。

實驗結果：

本文的實驗結果表明，PointPillars算法在隻使用雷射雷達資料的情況下，可以實作比現有方法更高的檢測性能。在KITTI 3D和鳥瞰圖檢測基準測試中，PointPillars算法的檢測性能顯著優于現有方法，即使與使用雷射雷達和圖像資料的融合方法進行比較，也具有更高的檢測精度。此外，PointPillars算法的運作速度也比現有方法更快，可以在62Hz的速度下運作，比現有方法快2-4倍。在更快的版本下，PointPillars算法可以在105Hz的速度下與現有方法比對。

結論與分享

PointPillars是一種專注于點雲資料的物體檢測算法，它在僅利用雷射雷達資料的情況下，實作了優越于現有方法的檢測性能。該算法不僅具備更快的運作速度和更高的檢測精度，還在KITTI 3D目标檢測和鳥瞰圖檢測基準測試中展現出顯著的優勢。即使與使用雷射雷達和圖像資料融合的方法進行對比，PointPillars算法依然表現出更高的檢測準确性。

值得注意的是，PointPillars算法不僅實作了更快的運作速度，達到每秒62幀的速率，比現有方法提速2-4倍，而且在更快的變體下，甚至可以達到每秒105幀的速率，與目前方法相媲美。是以，PointPillars算法在點雲資料物體檢測領域展現出了巨大的潛力。這一研究為點雲資料的物體檢測提供了一個有前途的解決方案。

作者 | 芊牛花

排版 | 春花

稽核 | 柒柒

若您對該文章内容有任何疑問，請于我們聯系，将及時回應。如果想要了解更多的前沿資訊，記得點贊關注哦~