雲栖号資訊:【 點選檢視更多行業資訊】
在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!
最新消息,阿裡達摩院又有新的研究進展,這次在自動駕駛3D物體檢測領域。
達摩院的研究人員提出一個通用、高性能的檢測器,在自動駕駛領域最重要的測試集之一 KITTI的鳥瞰(BEV)資料集上,檢測速度達到25FPS ,一舉占據榜首,與排名第二的方案相比,減少了一半多,同時精度也遠超其他的單階段檢測器。可以說首次實作3D物體檢測精度與速度兼得。

達摩院研究團隊表示:“檢測器是自動駕駛系統的核心元件之一,但該領域一直缺少創新和突破,此次我們實作3D檢測精讀和速度的提升,将有助于提高自動駕駛系統的安全性。”
從實驗結果來看,他們顯然取得了良好進展,而且研究的主要完成人員(一作),還是一名達摩院的實習生。
同時,該研究也得到了同行們的認可,被計算機視覺領域頂級會議CVPR 2020收錄。他們是如何做到的呢?我們借助阿裡達摩院提供的解讀,一一來看。
如何實作精度和速度兼得?
衆所周知,與普通2D圖像識别應用不同,自動駕駛系統對精度和速度的要求更高,不僅需要快速識别周圍環境的物體,還要對物體在三維空間中的位置做精準定位。
僅靠傳感器和算法模型,通常無法平衡視覺識别的精度和速度。是以,檢測器成為提升自動駕駛系統安全性的一個關鍵因素。
經過多年研究,目前業界主流的單階段檢測器在檢測速度上很好,但在檢測精度卻差強人意。
這就是達摩院研究的出發點:尋找一種能二者兼得的方法。
他們提出的思路是:将兩階段檢測器中對特征進行細粒度刻畫的思想,移植到單階段檢測中。
在他們的模型中,用于部署的檢測器, 即推斷網絡, 由一個骨幹網絡和檢測頭組成。
骨幹網絡用3D的稀疏網絡實作,用于提取含有高語義的體素特征。檢測頭将體素特征壓縮成鳥瞰圖表示,并在上面運作2D全卷積網絡來預測3D物體框。
他們在訓練中利用一個輔助網絡将單階段檢測器中的體素特征,轉化為點級特征并施加一定的監督信号。
在實作上,他們将卷積特征中的非零信号映射到原始的點雲空間中, 然後在每個點上進行插值,來擷取卷積特征的點級表示。使得卷積特征也具有結構感覺能力,來提高檢測精度。
而在做模型推斷時,輔助網絡并不參與計算(detached),保證單階段檢測器的檢測效率。
另外,他們還提出一個工程上的改進:Part-sensitive Warping (PSWarp),用于處理單階段檢測器中存在的 “框-置信度-不比對” 問題。
核心思路是:利用采樣器, 用生成的采樣網格在對應的局部敏感特征圖上進行采樣,生成對齊好的特征圖。最終能反映置信度的特征圖,是K個對齊好特征圖的平均。
單階段方法,能達到兩階段方法精度
阿裡達摩院的研究人員,在KITTI資料集上評估了方法的有效性。下圖(PR Curve)中,實線為兩階段方法, 虛線為單階段方法。
可以看出,達摩院提出的單階段方法(黑色)能夠達到兩階段方法才能達到的精度。
下圖展示了他們在KITTI 鳥瞰(BEV) 和 3D 測試集上的結果。
可以看出,他們提出的方法,可以在不增加額外計算量的情況下,達到25FPS 的檢測速度,而且還能保持精度。具體的檢測效果如下:
兩位共同一作,都是達摩院研究實習生
研究論文,标題為“Structure Aware Single-Stage 3D Object Detection from Point Cloud”,共有5名研究人員參與,分别來自阿裡達摩院和香港理工大學。
第一作者是Chenhang He,是阿裡達摩院的研究實習生,正在香港理工大學讀博,預計2022年畢業。
他的導師是達摩院進階研究員、香港理工大學電子計算學系講座教授、IEEE Fellow張磊,也是這一研究的通訊作者。
另一位第一作者Hui Zeng,也是是阿裡達摩院的研究實習生,同樣是張磊的博士生,預計在今年畢業。
其他作者,分别是達摩院進階研究員、IEEE Fellow華先勝、達摩院資深算法專家黃建強等。
【雲栖号線上課堂】每天都有産品技術專家分享!
課程位址:
https://yqh.aliyun.com/zhibo立即加入社群,與專家面對面,及時了解課程最新動态!
【雲栖号線上課堂 社群】
https://c.tb.cn/F3.Z8gvnK
原文釋出時間:2020-03-19
本文作者: 乾明
本文來自:“
51CTO”,了解相關資訊可以關注“
”