天天看點

毫末智行:自動駕駛,我是你的“破壁人”

毫末智行:自動駕駛,我是你的“破壁人”
毫末智行:自動駕駛,我是你的“破壁人”

作者:張葉子

編輯:Mark

出品:紅色星際(ID:redplanx)

頭圖:自動駕駛資料智能體系 “MANA(雪湖)”

12月24日,毫末釋出Q4最新進展,其中的亮點是:

——A輪融資近10億,晉升獨角獸俱樂部;

——在乘用車方向,這個季度增加了三款車型,瑪奇朵、拿鐵、哈弗神獸,至此,毫末成立2年的時間裡,搭載毫末産品的乘用車車型達到5款;

——小魔盒輔助駕駛裡程已經突破400萬公裡,再次重新整理前一季度的百萬裡程成績單;

——釋出資料智能系統MANA,真正意義上完成智能資料的閉環,城市NOH 34分鐘無接管“一鏡到底”曝光。

毫末正常的技術日也和特斯拉一樣,改名為AI DAY,顯示了自己在人工智能和自動駕駛方面的雄心,實力能否撐得起雄心,我們以Q4最新釋出為線頭來具體扒一扒。

毫末智行:自動駕駛,我是你的“破壁人”

1. 資料智能系統“MANA(雪湖)”

冬天是适合思考的季節。

在三體中,羅輯被選為面壁人之後,遁世到一片隻有森林、雪山、湖泊、木屋、壁爐、紅酒的世外桃源,在那裡,它和莊嚴度過了夢幻的五年。

五年之後,當所有面壁者都被破壁之後,莊嚴和孩子被“人質”,羅輯不得不直面人類危機,寒冬深夜,羅輯一人在結冰的湖面上散步,掉入冰窟,窒息中,他看到旋轉的黑暗星空,頓悟宇宙社會學真相,總結出黑暗森林法則,發出恒星咒語,為地球人扳回一局。

這個湖是天才思想、戰略轉機橫空出世的地方,然而在三體中,這是一個沒有名字的地方,因為女神莊嚴的一句話,不需要知道它在世界上的具體地點,知道了,感覺離世俗的距離就近了。

在中國西藏,有這樣一個地方,叫Mana(雪湖)。毫末用這個名字命名資料智能系統,用意十分明顯,希望在這裡,資料能真正變成知識和智慧,長成“破壁”自動駕駛的戰略武器。

智能系統是一家人工智能公司的核心競争力,恰如一個學霸天才的大腦,拿到資訊資料的原材料,學得又快又深,還可以舉一反三,不斷進步。

而且這種資料對毫末來講,早已不是實驗室級别的訓練集、也不是你知道它去哪也知道做了什麼事情的采集車資料,而是真正量産後來自真實世界千奇百怪的資料。

毫末的MANA系統在這個時間節點推出,完全基于企業面對的現實需求,而非口号。這個現實是什麼?

四百萬公裡的現實裡程帶來令工程師興奮的資料洋流,讓算法和架構迅速疊代,豐富餌料投喂之下,自動駕駛快魚迅速調整底層架構。

與此同時,未來可預期的海量資料(長城爸爸的掌上明珠,沒有猜忌鍊,沒有懸念,穩穩地上車)帶來的挑戰也要求底層構架能Hold住這種變化,存儲、傳輸、計算訓練、驗證、仿真、标注等等,各個方面都對系統提出更高要求(就在釋出日前一天官宣融資10億,錢也有了,PK特斯拉超算中心也安排上了)。

MANA架構

下面我們來了解一下MANA的具體構架。

毫末智行:自動駕駛,我是你的“破壁人”

(毫末智行資料智能體系 “MANA(雪湖)”)

MANA是毫末體系完善的研發體系,由四個大部分組成,分别是:資料看闆系統(VENUS)、車端系統(TARS)、大規模不間斷學習系統 LUCAS(Large Scale Autonomous Continuous Learning System)、底層系統(BASE)。

VENUS是資料看闆,我們去展示、審查、洞悉資料可視化的能力。

TARS是車端能力,包括TrasView(感覺),TrasGo(認知),規劃決策控制、Map(地圖定位),Meta(仿真引擎),它們更多為車端算法服務。

LUCAS是基于資料學習研發的一套系統,主要有診斷、分析、檢索三個子產品。核心是資料驅動,通過疊代資料來自動化地疊代模型。目前業内普遍疊代模型的思路是利用工程師來人工分析錯誤,将錯誤進行提煉總結,然後設計出合适的方案。這種方法在錯誤資料頻次高、共性多的時候能夠較好地解決問題,但面對海量資料和長尾,就會無能為力,LUCAS解決了這個問題。

BASE是中間件、資料存儲、資料計算相關的服務。

四部分的功能分别是:

TARS解決的是從0到1的問題。

LUCAS裡主要解決大規模泛化問題,從0到1之後如何從1到N,包括感覺泛化、認知泛化、車型泛化、晶片間泛化,标注、訓練,雲端自動問題的分揀、診斷,以及一些雲端和離線線上的評測。

BASE表達一種通用性,不管是車端做從0到1的原型研發,還是做大規模量産之後從1到N的泛化,都依賴于BASE。

MANA意義

表面上看,似乎每個自動駕駛公司的智能系統構架都大同小異,在之前也有一套資料系統運作,那Q4大力推出全新系統,與之前一直存在的有何不同呢?

據技術Leader介紹,不同主要在兩個方面:首先,之前的各個子單元雖然存在并運作着,但存在很多配合不好的環節,新系統對這些地方做了重新的整理和規劃。

毫末智行:自動駕駛,我是你的“破壁人”

(毫末智行MANA(雪湖)系統與特斯拉對比圖)

比如說LUCAS和TARS之間的配合。核心在于LUCAS和TARS之間的互動和配合,感覺和認知是完全兩套不同的LUCAS和TARS的配合方法,感覺比較常見的是TARS提供模型,LUCAS提供資料,1+1最後達到N的效果。在認知上不一樣,相當于LUCAS提供資料裡學到的毫末想要達到的目标,TARS通過強化學習、模仿學習把它再學習過來,最後部署到車端。

第二,梳理出了清晰完善的理論架構,相當于公司技術研發的一套頂層設計。在任何一個組織裡,頂層設計的重要性不言而喻,沒有頂層設計,公司的長短期目标、部門任務、業務權責無法有序展開,大家都不知道怎麼思考。有了MANA,資料智能處理能有序循環起來,組織也能更好分工協作,培育出自我生長的力量。

毫末智行:自動駕駛,我是你的“破壁人”

2. 技術亮點

感覺:從後融合到前融合

感覺方面,業界和毫末的通用做法是:拿到一張圖檔,通過一個骨幹學到不同的特征層,再基于不同的Head區隔不同任務,比如說一些分割,比如說一些道路元素,比如說一些障礙位等等。包括點雲也一樣,像小鵬和毫末的下一代車,搭載有雷射雷達,多個雷射雷達之間拼到一起,完成分割和障礙物檢測功能。

一張圖檔描繪相關的東西,但是前視相機不會和側前相機、雷射雷達有什麼互動,更多是在後融合的階段把目标結果進行融合。這樣的做法存在很多問題,最大的問題是——它沒有很好地利用好多個傳感器之間的配合和互動。

既然後融合弊端這麼大,為何還能成為業内主流呢?

原因是之前大家都跑高速,前面有一個攝像頭,一個Mobileye,很多主機廠做PNC相關的事情就夠了。

這些量産産品大多就前面有一個攝像頭,它所謂的融合是這個相機和毫米波雷達的融合,這種融合相對比較簡單的。

但到了複雜的城市,光看前面一個錄影機肯定不夠,360度都要視覺和點雲。以毫末的車為例,硬體裡有12個攝像頭,還有雷射雷達和毫米波雷達,那就是12個攝像頭之間的融合,難點會變很多。

那麼,如何把這些傳感器的資訊有效融合到一起?

毫末采用的方法是前融合的Tensor map思路。先是不同的相機、點雲提取特征,提取到張量的層次,在這個環節下再進行拼接,拼到俯視圖的視角,3D的次元,在3D次元上再去檢測相關的障礙物、車道線等等,形成一個Tensor map新的模式。

通過這種方式就可以有效解決後融合所引發的跨相機的追蹤,跨相機障礙物的分裂等等這種問題,可以提高複雜場景下對于障礙物和車道線感覺能力。

此外,還有一個和其他的一些國内公司稍微不太一樣的點是——毫末會直接預測深度資訊(和特斯拉一樣)。很多公司采用的技術方案是——模型隻預測2D的資訊(比如說圖像上像素點上的資訊),再通過後處理的方法(比如說IPM),通過一些幾何關系去倒推計算深度資訊。

這個方法毫末之前嘗試過,在高速上面沒有什麼問題,在城市場景裡面效果不太好,因為高速上車少,也比較簡單,車也沒有什麼特别詭異的、逆行的,而在城市裡面這種效果就會很差,它的測距精度不太高,深度資訊回歸的不好。

和特斯拉不一樣的是,毫末在預測之前先把特征次元就做了一次融合,基于這個融合之後的特征,再去預測這個東西是障礙物還是車道線,相當于是一個後融合。

那麼,兩者的效果如何呢?

公司每隔一段時間都會做競品測試,目前來看,兩者都很不錯,但也都是剛剛開始(特斯拉最近才将前視和前玻璃融合),可以互相借鑒,取長補短。

毫末智行:自動駕駛,我是你的“破壁人”

(毫末智行Transformer與CNN深度融合理念)

正如公司CEO顧維灏所說,Transformer技術可以幫助自動駕駛感覺系統更深刻地了解環境語義,與CNN技術的深度融合将會解決AI大模型量産部署的難題,Transformer與CNN深度融合将會成為自動駕駛行業下半場競争的關鍵技術。

而這個融合也是MANA(雪湖)系統的精華之處。

認知智能:讓人工智能更像人

認知智能,這又是今年的一個熱門提法,但究竟是什麼,大部分人還是一頭霧水,為什麼呢?和感覺一比較就知道了。

感覺要解決的是從傳感器信号中重建客觀世界的問題,感覺目前相對成熟,雖然大家感覺做的程度不太一樣,有些人做得好,有些人做得一般。但是感覺它有最重要的特點,它有清晰标準。客觀世界什麼樣的,你看到的感覺出來的結果就是什麼樣的,完全白盒的,沒有歧義,剩下的就是用巨量的資料去保證覆寫掉所有的Corner Case。

而認知要解決的是從客觀世界到駕駛動作的映射問題,它本身就沒有這種共識性的衡量标準。比如說一個人現在要左轉,對向正好來車,老司機一腳油就過去了,而對于剛拿本的司機可能就選擇讓行。那在安全的前提下,究竟哪種是更好的駕駛政策呢?

毫末智行:自動駕駛,我是你的“破壁人”

(MANA認知智能資料圖檔)

認知智能的核心是通過大量資料在複雜場景裡學習人開車的規律和人開車的方法,用這個資料來指導算法和疊代。

他要解決的問題是讓機器達到像人一樣開車的體驗,而非充滿機械化痕迹。

雖然目前不少公司也都在朝這個方向做,但發展階段存在差異,大部分公司還停留在從傳統機器人理論衍生出來偏幾何學、偏機器人運動學的階段,通過規則式的、求解的方式來進行軌迹規劃。比如精确測量出來這個車距離我20.5米,那個車距離我16.8米,是以我就要這麼走。

而顯然人在開車時并非如此,而是在一些基本的社會常識和駕駛規範的基礎上,按照自己的目的更智能地去選擇自己的駕駛行為,而不是通過純粹的數學計算來駕駛車輛。

通過複雜的認知算法體系,毫末想要實作的第一步是,讓自動駕駛符合大衆的口味,第二步則是通過使用者畫像,實作自動駕駛司機的千人千面。這點很容易了解,先要達到平均分,讓大部分人感覺OK,然後讓各種人都滿意。因為進階白領林妹妹、肌肉達人李逵、霸道總裁周瑜開車、小鮮肉唐僧的駕駛風格和對駕駛體驗的要求肯定是非常不同的。

是以毫末專門建立了一套體系。這套系統包括三個向量,安全、舒适、高效。

以安全為基礎,通過将場景和動作被數字化後,從大量的資料中提煉出舒适和高效的量化标準,這樣就可以避免純機械的操作,讓使用者感覺是老司機在開。

毫末智行:自動駕駛,我是你的“破壁人”

3.進階之路

從原始社會進入封建社會,看天吃飯的原始人不懂,面對同一片土地,為什麼有的部落冬天也能吃到糧食了。

從封建社會進入資本社會,地主們不明白,為什麼土地、勞動力、生産工具都在我手裡,還是被資本家幹翻了。

一如以後新一茬的Old Money不懂,資源都在我手裡,怎麼就被革命了呢?

原因高中課本說得很清楚,新的生産要素出現,帶來生産力和文明形态的大變革。

而資料就是讓人類文明産生第四次大變革的那個新生産要素。

為了表達對資料信仰的重視程度,毫末用“思想鋼印”來表達它,每個三體讀者都知道思想鋼印的威力,它代表深入骨髓的堅信,不需要再去接受任何理性判斷的審視。

但在通往L5的路上,信仰需要正确的戰略思想,風車戰略和漸進路線是毫末的選擇。

風車戰略

什麼樣的公司能成功?一定是掌握規律并最領先于對手的,Why?

在這裡,黑暗森林兩條基本公理同樣适用:

第一,生存是文明的第一需要。

第二,文明不斷增長和擴張,但宇宙中的物質總量保持不變。

毫末對自動駕駛實作的判斷是自動駕駛商業化三定律:

第一,從低速到高速;

第二,從載物到載人;

第三,從商用到民用。

從目前來看,封閉場景的餐廳酒店服務機器人、倉庫倉儲機器人、家庭的掃地機器人都已經被商業化。開放場景的無人物流也在今年快速走向商業化。

先從最快商業化的無人物流小車、乘用車輔助駕駛、智能硬體三個戰略主戰場入手,取得造血能力和資料能力。但核心是打造自己的核心——資料智能,在總量有限的市場上,争取領先優勢,形成對資金、人才、資料疊代的馬太效應。

董事長張凱對自動駕駛的另一個判斷是:對于賽道參與者而言,在2022年沒有形成自己相對穩定的商業模式是緻命的。

從外部環境來看:

第一,與前幾年智能手機市場比較類似,行業将會從最初的倒三角型形态向呈現T字形态轉變,頭部效應越發明顯。2022年,有高效、低成本的資料智能體系,實作規模量産的企業與其他企業的差距将有顯著拉開。

第二,資料安全與資料合規将進一步增加自動駕駛資料智能體系的閉環難度和成本,對于沒有在此之前打好基礎的企業,随着2022年國家層面将會出台細則強制執行資料安全上位法,完成同樣的體系建設,難度和成本驟增。對于新進入者,更是相當與加高了行業進入壁壘,機會視窗幾乎已經關閉。

毫末智行:自動駕駛,我是你的“破壁人”

(毫末智行董事長張凱)

從各個方面看,2022年将是毫末拉開與友商差距的一年。張凱提到的要打赢“無人物流車”、“城市場景輔助駕駛”和“資料智能”三場戰役,都有比較堅實的基礎。且公司目前已經準備好了充足的技術彈藥和資金,營業額已達數億元,加上剛融資的近10億人民币。

整個毫末團隊都在摩拳擦掌準備2022年的三大戰役。

“無人物流車”方面,實際上智能硬體核心就是智能底盤,而毫末隻是把這個智能底盤用在無人物流車上,其實最早公司有一個産品做Mini bus,但當時的判斷,Mini bus的商業機會來的更晚一些,是以暫時封存了Mini bus的很多技術,直接把底盤拿出來更多的去拓展無人物流。

市場上現在很多初創項目做自動駕駛底盤,而究竟做得好不好,取決于團隊基礎能力:第一,是不是真的能設計出來,第二,取決于它的供應鍊能力,是不是真的能夠做低成本。本質上,汽車硬體拼的就是規模效應。而長城的背景讓毫末能迅速推出十多款相關硬體産品。

正如美團的李達總所說,市場上找了一圈,最後發現毫末的底盤最好。

12月份,毫末智行迎來第1000輛末端無人物流車的量産下線,2022年,毫末智行團隊打算将無人物流車項目擴大3倍,達到3000輛(這些計劃都是根據合作夥伴的2022年規劃)。

這些并不是拍腦袋拍出來的資料,而是通過團隊沙盤推演推出來的。

毫末智行:自動駕駛,我是你的“破壁人”

(毫末智行智能駕駛産品路線圖)

其次是城市輔助駕駛場景之戰。2022年,乘用車輔助駕駛的競争将會進入下半場,下半場的競争主要集中在城市開放場景的領航自動駕駛。毫末智行為此儲備了小魔盒3.0計算平台、新一代AI自動駕駛技術、MANA資料智能體系,以及其最強的技術工程化經驗。

最後是資料智能MANA(雪湖)系統,MANA的推出将幫助毫末在資料處理和智能分析上建立更大的優勢。

打破自動駕駛分級思維

長期以來,自動駕駛分級是各種迷思和争論的重災區。

比如宣傳中的PK,你說L2、L2+、L3、L3+,和孔乙己寫茴香豆似的。再比如行業中L2搜集的資料L4到底能不能用的問題。

那L2到L4,對毫末來說,資料到底能否通用呢?

公司技術Leader告訴筆者,一方面,從硬體和軟體開發上來看,并沒有看到L4和所謂的L2之間有什麼差別,唯一的差別可能在于使用者接管政策的不同。比如說使用者不扶方向盤,所謂的L4不扶就不扶,無所謂,可能所謂的L2來說,你不扶我就提醒提醒你等等。這些簡單來說是一些軟體的開關,差別不在硬體和算法上。

另外,不管L幾都有自己的資料價值,問題的本質不在于資料本身的品質和結構,而在于怎麼能夠更好地應用。

是以毫末選擇先要盯着更多功能、更好的使用者體驗去做。在之前的技術日上,CEO 顧維灏也曾經說過,做L2的,包括特斯拉在内,無論是硬體設計、軟體開發、還是産品政策,都是瞄着更進階别的,對使用者帶來更好體驗的,往更好的目标去做的。

在目前來看,使用者并不關心L幾,而是更關心安不安全、體驗好不好、接管率高不高這些名額,是以,這個分級的概念也正在淡化。

毫末智行:自動駕駛,我是你的“破壁人”

(毫末資料智能思想鋼印)

得益于毫末開放透明的文化,無論是行業小白還是小紅,都能從每季度的AI DAY上了解到公司技術、組織、戰略、思想、合作夥伴方面的變化。

自動駕駛是一場全社會的馬拉松,需要更高效的協作,開放有益進步,希望,在這場比拼中,毫末能用自己的聲音喊出一聲:

自動駕駛,我是你的破壁人!

另外,整個公司從辦公室到系統,每個毛孔都充斥着濃濃的三體味,釋出會都要發書,下次AI Day,咱們能不能憑這份狂熱,感動劉慈欣,把他拽到車上,和這次融資十億一樣,再上個國際頭條。

-END-

毫末智行:自動駕駛,我是你的“破壁人”

繼續閱讀