天天看點

高精度地圖:自動駕駛的向導

作者:ICVS智能汽車産業聯盟

來源:智能汽車設計 作者:Dr. Li

高精度地圖是伴随着自動駕駛而生的,是目前研發L3及以上自動駕駛技術的标配。高精度地圖是以厘米級精度來描述道路細節的資料集。與傳統導航地圖不同的是,高精度地圖除了能提供的道路(Road)級别的導航資訊外,還能夠提供車道(Lane)級别的導航資訊。無論是在資訊的豐富度還是資訊的精度方面,都遠遠高于傳統導航地圖。

高精度地圖:自動駕駛的向導

圖1 導航地圖(左)與高精度地圖(右)對比示意圖

01 國内外高精度地圖發展概述

Waymo早在2009年就在為自動駕駛建構地圖。随後,由于大算力晶片以及深度學習技術的蓬勃發展,自動駕駛技術能落地的場景也變得越來越豐富,同時自動駕駛技術本身帶來的巨大商業價值,吸引了越來越多的國内外玩家進入該領域,進行深入研究來實作各類場景的落地。高精地圖作為自動駕駛技術中的重要環節,在定位、感覺、規劃甚至端到端的自動駕駛算法中都能提供技術支撐,越來越多的企業加入了高精度地圖制作行業來加速自動駕駛快速落地。

除了Here、TomTom等傳統圖商先後加入到高精地圖制作外,自動駕駛技術公司Mobileye,Tesla等在自研高精度地圖上也投入了大量精力。國内廠商緊随其後,2013年,國内圖商四維圖新、高德、寬凳科技等加入高精度地圖的制作,同時,自動駕駛技術公司百度、Momenta等為滿足L3級别的自動駕駛的要求也開始了高精度地圖的制作和使用。

高精度地圖在自動駕駛中的作用主要展現在如下幾個方面:

感覺:紅綠燈感覺、車道線感覺、超視距感覺等大大簡化了自動駕駛過程中後續預測以及規控算法設計的複雜度。

路徑規劃與決策:使用高精度地圖提供的資訊提前進行路徑規劃,同時根據障礙物所在車道位置或者紅綠燈等資訊預測障礙物可能的運作軌迹,進而提前做出預判和決策。

安全:在雨雪、大霧等極端天氣下,各傳感器可能會出現一定失效或者感覺結果不準确,高精度地圖可以有效的進行資訊的補充,進而保證自動駕駛汽車行駛過程中的安全性,同時,在一些如多層立交、隧道等複雜的道路場景下,利用高精度地圖,結合視覺毫米波雷達、雷射雷達等無源定位的無源傳感器,實作自主定位,這種融合定位的方式會大大提升定位的準确性,也會進一步提升自動駕駛的安全性。

02 高精度地圖制作方案對比

目前高精度地圖的生産制作主要是兩種方式,一種是采用攝像頭這種純視覺的生産方式,代表的公司Deep Motion、寬凳科技、Momenta等初創公司,純視覺的生産方式除了大大降低生産成本,還會使得高精度地圖制作的周期大大降低,加速高精度地圖衆包方案的落地,但是對算法技術的創新有較高的要求。另一種主流的方案是采用以雷射雷達為主的高精地圖采集方案來進行高精度地圖的生産(圖2為高精度地圖采集車示意圖以及實物圖),代表公司有很多,例如Waymo、百度、四維圖新、高德等,采用雷射雷達為主,攝像頭為輔的方案相對來說技術比較成熟,可以綜合利用各個傳感器的優勢進行算法的研發,簡化了後續算法研發的複雜度。但是生産制作成本高,生産周期長,同時不利于衆包更新高精度地圖方案的落地。

高精度地圖:自動駕駛的向導

圖2 高精度地圖采集車示意圖與實物圖(從左到右)

03 高精度地圖制作技術發展趨勢

高精度地圖可以分為兩個層級:靜态高精度地圖和動态高精度地圖。受限于晶片算力以及制作成本的考慮,目前的高精度地圖制作都是圍繞靜态高精度地圖展開的,其組成主要包括車道線資訊、方向箭頭資訊、道路标志牌資訊、道路屬性資訊等。在靜态高精度地圖圖層之上,動态高精度地圖主要包括道路上發生的實時動态資訊,主要包括随時間變化的交通标志(如紅綠燈狀态、潮汐車道等)、道路交通資訊(道路擁堵情況、事故發生情況、道路施工情況、交通管制情況、天氣情況、路面積水情況等)。目前高精度地圖的生成一般涉及到的技術為資料采集、栅格圖預處理、資料标注、檢測識别、自動矢量化等生産流程,如圖3所示。

高精度地圖:自動駕駛的向導

圖3 高精度地圖生産流程

  • 資料采集技術:一般利用多傳感器GPS、IMU、輪速計、雷射雷達或者攝像頭融合技術計算出目前采集車的位置資訊,讓後将該位置資訊以及雷射雷達/攝像頭的掃描資訊寫入到地圖資料中。
  • 栅格圖預處理:這裡主要涉及點雲拼接、栅格圖融合以及僞影去除等。
  • 資料标注:利用标注工具對需要識别的元素按照一定的規則進行标注。
  • 檢測識别:這裡主要是利用深度學習算法進行檢測和識别,提供目标元素的語義以及位置資訊。
  • 自動矢量化:按照一定的精度要求,給出利用點線以及多邊形所描述目标物體的坐标資訊。這裡主要涉及資料采樣、多邊形拟合等傳統圖像資料處理算法。

可以看出整個流程還是相當繁瑣的,同時制作成本也是相當高的。加上後期的地圖更新和維護成本也會是相當複雜和價格高昂,這些都大大限制了其使用範圍,尤其是在自動駕駛領域大規模的落地使用和更新。

是以,為了解決在自動駕駛技術落地高精度地圖使用的問題,産生了實時局部高精度地圖生成的技術路線。相比較傳統的高精度地圖生成,該技術路線主要展現在高精度地圖生成的實時性以及空間範圍的局部性(隻産生處在目前車輛周邊環境的高精度地圖資訊以供自動駕駛使用)兩個方面,如圖4所示。

高精度地圖:自動駕駛的向導

圖4 傳統高精度地圖生産與實時局部高精度地圖生産方式對比

2021年,實時局部高精度地圖技術路線主要是利用多視圖攝像頭/雷射雷達采集到的圖像資料利用神經網絡進行特征提取并利用相機外參投影到鳥瞰圖視角下,在鳥瞰圖視角下進行解碼操作得到車道線的分割資訊以及車道線方向資訊,在經過後處理操作得到矢量地圖,如圖5所示。

高精度地圖:自動駕駛的向導

圖5 線上局部高精度地圖生成模型

2022年,實時局部高精度地圖技術路線迎來了比較大的變化,第一個比較大的變化是整個實時局部高精度地圖生成變成端到端的方式,不再需要根據車道線的分割結果等進行矢量化後處理操作。第二個比較大的變化是,transformer網絡結構被廣泛地使用在圖像或者雷射雷達資料特征圖的編解碼階段直接輸出矢量化的地圖資料,包含道路線的關鍵點資訊,關鍵點之間的起始順序以及拓撲結構資訊。比較有代表性的工作有VectorMapNet(如圖6所示)、該方案将不同模态(如攝像頭圖像和雷射雷達點雲)生成的特征轉換為鳥瞰圖特征後,再聚合到一個公共的BEV特征空間中;然後,基于transformer的網絡結構進行車道線的關鍵點預測,最後利用注意子產品模組化生成關鍵點之間的拓撲連接配接關系。

MapTR(如圖7所示)的方案首先是對原始圖像進行語義特征提取,之後轉換為鳥瞰圖特征,采用transformer變體結構,使用分層級的query embedding機制結構化地編碼地圖要素的資訊,最終輸出地圖要素的語義類别和節點位置。特斯拉的Lanes Neural Network(如圖8所示)則更加面向工程化一點,Lanes Neural Network不僅用到了圖像資訊,而且其用到了導航地圖的文本資訊,例如車道線的數量、寬度、拓撲連接配接關系等屬性描述,通過嵌入操作和視覺圖像的特征資訊統一到同一個特征張量空間輸入到transformer網絡結構進行解碼輸出,這也是文本與圖像資訊首次進行特征融合被用在局部高精度地圖自動生成建構中。

其大概的過程如下:首先是視覺特征作為輸入,利用transformer結構,網絡會先預測關鍵節點的粗略位置,再以粗略位置所在的局部範圍進行更精确的位置預測,然後預測該節點的語義資訊,最後預測節點的連接配接拓撲關系,如分叉/并道/曲率參數等。網絡會以這樣自回歸的方式将所有的車道線節點進行生成(按照一定順序,如自上而下,自左到右)。

高精度地圖:自動駕駛的向導

圖6 VectorMapNet網絡結構圖

高精度地圖:自動駕駛的向導

圖7 MapTR網絡結構圖

高精度地圖:自動駕駛的向導

圖8 Lanes Neural Network網絡結構圖

04 高精度地圖制作技術發展趨勢

從目前的技術發展路線來看,未來自動駕駛所需的高精度地圖使用方式無論從制作成本、使用的便利性以後續更新的實時性角度考慮,很大機率會使用這種局部實時建構高精度地圖的方式,感覺資料輸入會分為純視覺(多視圖)以及視覺與雷射雷達融合輸入的方案,但都是在鳥瞰圖視角下利用transformer網絡結構對多源資料(攝像頭、雷射雷達)進行感覺特征的統一表征,同時為了提高車道線關鍵點之間拓撲結構關系描述的準确性以及更多的高精度地圖元素輸出,帶有地圖文本描述的資訊會越來越多的加入到網絡結構中,利用transformer網絡結構将這些特征資訊進行互動得到更準确的位置資訊以及更多的高精度地圖元素輸出,而不局限于隻有車道線、人行橫道線等有關高精度地圖線資訊元素的矢量化輸出。

通過将視覺感覺、文本、語音等不同模态資料,通過映射到同一語義空間進行特征對齊後,利用transformer網絡結構進行特征互動學習得到統一的多模态特征,靈活的根據不同的下遊任務進行特征解碼操作也将是未來很多AI模型訓練的一種方式。

參考文獻:

[1] https://ryanadex.github.io/2019/06/04/opendrive/

Opendrive地圖資料解析

[2] Q. Li, Y. Wang, Y. Wang, and H. Zhao. Hdmapnet: A local semantic map learning and evaluation framework. arXiv preprint arXiv:2107.06307, 2021

[3] Yicheng Liu, Yue Wang, Yilun Wang, and Hang Zhao. Vectormapnet: End-to-end vectorized hd map learning. arXiv preprint arXiv:2206.08920, 2022a

[4] Liao B, Chen S, Wang X, et al. MapTR: Structured Modeling and Learning for Online Vectorized HD Map Construction[J]. arXiv preprint arXiv:2208.14437, 2022.

[5] Thinkautonomous.ai, “A Look at Tesla’s Occupancy Networks”,

https://www.thinkautonomous.ai/blog/occupancy-networks/

[6] 地圖采集車的那些事 | 載車篇

https://zhuanlan.zhihu.com/p/367189697

繼續閱讀