天天看點

毫末智行技術揭秘 城市NOH何以做到今年落地

短短三年時間,毫末智行從成立到量産,成為發展速度最快的自動駕駛公司之一,它能在短期内迅猛發展的秘訣是什麼?有人說是長城的背書,有人說是AI大牛的支援,而今天我們來說說毫末智行的技術。

今年初,毫末智行的HPilot2.0剛剛搭載到坦克500上,如今HPilot3.0也即将釋出。最近,技術總監潘興對外透露了HPilot3.0在技術與資料層面的進展和創新。

硬體方面,HPilot3.0擁有360TOPS的算力,也是目前在自動駕駛業内算力最強的一款硬體。全車配備12個攝像頭和2個雷射雷達,5個毫米波雷達,12個超音波雷達。

不用高精地圖 城市道路也能跑

高精地圖就像提前做了踩點的助手,讓你再次走上一條熟悉的道路。有了高精地圖就有了出行的方向,然而,高精地圖也有它的局限性,一方面其制作成本很高,另一方面需要國家審圖通過才能使用,目前還沒有一版完整的城市道路高精地圖在政策許可範圍内。

與此同時,對智能駕駛的需求已經來勢洶洶,眼下在無高精地圖的情況下去實作更智能化的輔助駕駛勢在必行。

毫末智行HPilot 3.0旨在實作這一想法,主打城市自動駕駛場景。

首先在感覺層面。HPilot 3.0能夠提前監測到紅綠燈,據潘博介紹,第一步是識别,第二步是綁路。

毫末智行技術揭秘 城市NOH何以做到今年落地

由于紅綠燈多樣性的變化,長尾資料處理起來較多,毫末智行和大多數AI公司一樣,采用的是仿真系統。但仿真和現實總會有差距,由此采用“混合遷移學習”來處理和彌合二者的差距。

潘興介紹到,“該學習模型拿到的既有仿真資料,也有真實資料。學完之後,在真實資料上的效果是完全可以把仿真資料利用起來的。比如在Loss上面增加了兩個資料集遷移的距離,通過這種方式學習讓兩種資料集的機率分布趨同。

在遷移學習之前,合成資料和真實資料是分布在各自的次元上。這種情況下學習的效果并不理想。通過混合遷移學習之後,合成資料和真實資料幾乎就被拉齊了。由此,虛拟的仿真資料補進去之後,在真實世界裡面它的表現就能自動變好。通過這種方式,能夠快速收斂掉各式各樣的紅綠燈,根據不同的紅綠燈狀态完成紅綠燈識别。”

毫末智行技術揭秘 城市NOH何以做到今年落地

關于綁路,是為了解決複雜路況、交通訓示燈繁多下的識别能力。

“在一條路上無法确認該遵守哪個紅綠燈的情況下,HPilot也是通過一個模型學習的。當輸入一張圖檔之後會有一條分支,來處理紅綠燈檢測問題,在圖像上把紅綠燈檢出來。還有另外一個分支,會通過注意力機制,學習出來一個Feature Map,表達該紅綠燈和道路結構的關系。

通常來說,看到一個道路形狀,Feature Map的熱力圖大機率能确認相應的紅綠燈位置,然後再把它們綁定到一起。通過這兩種方法,一個是檢測,一個是通過模型學習場景并綁定,就可以找到該紅綠燈在道路上的拓撲資訊。”

紅綠燈識别隻是HPilot3.0的識别能力之一,其通過Transformer大網絡還能解決城市車道線的各種挑戰,這些技術使得車輛在城市場景沒有高精地圖的情況下,依舊能提升紅綠燈和車道線的感覺能力。

從感覺到認知,要想讓車輛像人類司機一樣去做判斷與決策,難度更大,尤其在中國城市道路上存在多重的互動問題。

在諸如環島、擁擠車流彙入、壓速變道等挑戰面前,毫末智行做成TarsGo Model,通過模型學習和立體化學習的手段,學習人類司機在這些場景下面的動作。

TarsGo提供了車端的模型,需要大量人類的資料去訓練。在這方面,毫末智行和阿裡達摩院一起基于阿裡PAI的架構,共同使用M6大模型,為自動駕駛的資料進行了資料挖掘。M6不光能夠用在采集車、使用者的車傳回來的這些量産資料上,同樣能夠用人類社會每天都在源源不斷産生的生活中的資料,和其他行業的資料,郵戳來疊代自動駕駛的能力。潘興稱,“M6在自動駕駛領域的應用标志着AI模型能力的普惠化”。

獨家MANA智能資料體系支撐

無論是感覺還是認知,背後支撐的都是大量的資料,兩個子產品背後正是依托MANA資料智能的體系疊代和演進的。

毫末智行開創的MANA資料智能的體系在成本與速度上做到了超越。

據透露,在資料标注方面,毫末智行利用自行建立的自動标注能力,相比人工标注可有效降低80%以上的成本,而通常資料标注成本就占到了總成本的三分之二,是以這是一筆不菲的支出。隻有當标注成本下降了,整個資料智能的體系運轉才會更加健康。在訓練方面,整個成本下降了62%,加速比提高到了96%。

建立資料自行标注能力,在前期是需要投入大量精力的。潘興對車雲菌表示,自動駕駛本身是一個資料密集且對資料的标注品質要求很高,是以資料标注是核心競争力的展現。

為此,毫末智行也專門組建了單獨的資料自動标注的算法團隊、工程團隊。“标注要求比感覺更嚴格,2D的像素上可能就要3個像素以内能框得出來,3D上可能就是幾厘米的誤差,這個框要足夠準。而且自動駕駛不光是要框出這個物體,對這個物體的屬性要求還很高,這個物體是被遮擋還是截斷,是在地面上還是馬路上,是騎自行車還是騎摩托,是三輪摩托還是老頭樂,這些都要有一個明确的語義标注。是以在2D、3D以及屬性的标注上,我們都是經過了很大優化的工作量。”潘興稱。

是以,MANA資料體系在成本和速度上為毫末智行後續的産品研發與落地提供了很強的便利性,使得城市NOH功能今年即可落地。

相比于同業公司的城市輔助駕駛功能落地進度,毫末智行搶在了領先的位置。在高速道路布局輔助駕駛的能力已經基本實作後,主戰場轉移到了城市場景。

在潘興看來,毫末智行之是以能率先落地,其一是采用重感覺的方案。當其他同行還在研發的階段,他們就可以在大規模的城市部署,使用者可以使用。如果是重地圖的方案,城市高精地圖會受到限制。毫末智行城市NOH今年6月份SOP,并可以做到全國100多個城市有效的部署,是以在範圍上具有很大優勢。

其二是搭載在長城大體量車型上。整體部署範圍大、車型多、數量多,我們基于更多的資料,持續疊代的速度也是競争優勢之一。

車雲小結

自動駕駛從高速席卷到城市内,面臨的技術難題遠比大衆看到的多,繼續解決和普及自動駕駛依舊任重道遠。毫末智行董事長張凱提到的“三大戰役”——“資料智能技術之戰”、“智能駕駛城市場景之戰”、“末端物流自動配送車的規模之戰”何嘗不是整個自動駕駛行業的戰役。

繼續閱讀