天天看點

特斯拉自動駕駛在中國為何不如小鵬?

特斯拉自動駕駛在中國為何不如小鵬?

“我們有信心,在今年年内推出來的城市NGP效果,會相當程度上比FSD的效果要好。”3月26日,何小鵬在百人會論壇的采訪上向《電動汽車觀察家》明确表示,小鵬汽車将于2026年開始向無人駕駛過渡的目标。

此時距離何小鵬喊話特斯拉創始人馬斯克——“(要)在中國的自動駕駛領域打得(特斯拉)找不着東”剛過去16個月。

特斯拉自動駕駛在中國為何不如小鵬?

何小鵬2020年社交媒體發言

當然特斯拉也沒閑着。

4月,馬斯克表示可實作“完全自動駕駛能力”的FSD測試版已搭載在超10萬輛特斯拉車型上。近日釋出的特斯拉2021年影響力報告表示,美國所有汽車相比于使用Autopilot自動輔助駕駛的特斯拉汽車發生事故的機率要高8倍。馬斯克表示,這項資料将趨向于超過10倍。

但在中國,由于開放功能過少,昂貴的FSD對特斯拉車主來說品牌标簽的意義遠大于使用價值。

2020年的小鵬科技日上,一段小鵬NPG/特斯拉NoA導航領航駕駛輔助系統的對比實驗中,小鵬P7表現穩定,特斯拉Model3則有了一系列無故、違規變道和錯誤駛出的情況發生。

這一表現也與中國媒體屢次的對比測試結果一緻:在北美開始測試完全自動駕駛的特斯拉,在中國結構化道路上仍水土不服。

晚七年出發的小鵬,現在的自動駕駛能力能否與特斯拉一較高下?何小鵬說要趕超特斯拉,是在吹牛嗎?

更重要的是,以特斯拉和小鵬為代表的純視覺和感覺融合兩大技術路線,在量産自動駕駛這一目标下的差異怎樣,前景又如何?

01

在中國,特斯拉比小鵬“差”在哪兒?

本質上,如今的純視覺感覺的特斯拉車型,和依靠多傳感器融合的小鵬車型已是運作模式大相徑庭的兩種“生物”,且“栖息地”也大為不同。

1.1 | 純視覺VS多傳感器融合

特斯拉FSD完全靠“看”。車身四周的8枚攝像頭,以每個攝像頭36幀每秒的速率采集,分辨率為1280×960、12-Bit的RAW格式圖像。

原始圖像資料直接進入名為“HydraNets(九頭蛇)”的單一純視覺神經網絡算法中,進行圖像拼接、物體分類、目标跟蹤、引入時間序列的線上标定、視覺SLAM(定位與地圖建構)等一系列能讓機器明白“我拍的是什麼”,最終形成一段路況時空的“向量空間”——對真實實體世界的虛拟映射。

“最困難的是建立一個準确的向量空間,”馬斯克表示,“一旦有了準确的向量空間,控制問題就類似于電子遊戲。”

特斯拉自動駕駛在中國為何不如小鵬?

向量空間,特斯拉AI DAY 2021年8月

“向量空間”是所有L3級及以上高階駕駛輔助系統的必要條件,差別在于如何擷取(感覺)真實世界的資料。

從P7開始,XPILOT智能駕駛輔助系統(下稱XPILOT)形成了“小鵬風格”的融合感覺系統:前視三目攝像頭+翼子闆側後視攝像頭+反光鏡前視攝像頭+後視攝像頭+五個毫米波雷達+四個環視攝像頭+十二個超音波雷達+高精地圖+高精定位。

從P5開始,XPILOT又引入了雷射雷達。

特斯拉自動駕駛在中國為何不如小鵬?

小鵬P5将适用城市NGP

雷達提供直接的速度、深度、距離和部分材質資訊,其中雷射雷達能夠直接對現實場景進行3D點雲的虛拟模組化;攝像頭則對行人、交通标志标線等多細節進行感覺。之後,通過融合算法模式,将不同傳感器的原始資料或感覺結果進行4D一緻化的融合,由此建立向量空間。

兩套方案各有優劣。

視覺方案具有極大的成本優勢。單目攝像頭成本僅在150-600 元之間,較為複雜的三目攝像頭成本也通常在1000 元以内。

特斯拉的8個攝像頭成本在200美元(1400元)之内,加上自研的自動駕駛晶片,總成本不到1萬元人民币。

多傳感器融合方案在攝像頭之外,毫米波雷達成本在50美元左右、半固态雷射雷達普遍在幾百美元,以及高精地圖的費用。

2019年,高德地圖宣布100元/車/年的标準化高精地圖合作價格。但頭豹研究院在報告中認為,除基礎服務外,高精地圖圖商還收取輔助自動駕駛服務費,行業價格或為700-800元/車/年。

成本是技術量産規模的決定性因素,但技術的可靠性和可實作性更加重要。

距離/深度/速度探測是視覺方案的劣勢之一,要通過2D的圖像來建構3D+時間的向量空間,中間不但存在2D“翻譯”到3D所帶來的延遲問題,而且對圖像處理算法、AI學習所用的場景數量/品質,和硬體算力都要求極高。

例如,去年特斯拉取消毫米波雷達之後,FSD測試版的自動轉向功能設定了75 英裡/小時(120公裡/小時)的最高速度和最少三輛車的跟車距離。之後兩個月,特斯拉将限速提高至80英裡/小時(128公裡/小時),跟車距離降低到兩個車身長度。

多傳感器方案則擁有雷達直接提供的距離/深度/速度資料,以及高精地圖提供超視距的先驗資訊,以及高精定位子產品提供的分米甚至厘米級定位能力。

“(由此)幫助AI了解,決策和規劃接下來的動作,為基于其他傳感器的感覺能力提供輔助和備援的資訊來源。”小鵬汽車自動駕駛副總裁吳新宙向《電動汽車觀察家》表示。

特斯拉自動駕駛在中國為何不如小鵬?

自動駕駛各級别對應像素數、資料量以及算力需求(估計值)《中金 | AI十年展望》

獲得足夠的備援,是L4級自動駕駛公司和小鵬等公司,選擇多傳感器融合而非純視覺路線的主要原因。

目前,由于純視覺沒有對速度、加速度的直接測量能力,幽靈刹車會是長期難以根治的問題。

未來,對高階自動駕駛系統所需要的預期功能安全和功能安全來說,防止單一系統失效,收窄失效預期備援是必須的,“目前純視覺系統很難達到高階自動駕駛所需的安全需求。”一位自動駕駛領域專家向《電動汽車觀察家》表示。

1.2 美國的特斯拉與中國的小鵬

“栖息地”的不同進一步加大了兩條技術路線的落地表現。

中國交通環境的複雜程度遠超美國,需要大量視距之外的輔助資訊提供給決策系統,才能順利完成通行,也導緻僅依賴實時、純視覺感覺系統,很難在中國落地。

特斯拉自動駕駛在中國為何不如小鵬?

中、美最複雜的立交橋系統:美國亞特蘭大(左)與中國重慶

例如,即使是屬于簡單場景的封閉高速路,中國相比美國路彎道更多、曲率更大,甚至有兩圈疊套的路段,能“一眼看到”的路線非常短暫;中國的高速路還有更長的進出匝道,和更頻繁變換的虛實車道線,甚至本不應出現在封閉路上的行人。

部分企業在實踐中發現,由于交通參與者通行規範程度的差異,自動駕駛系統在美國過路口比中國“容易”近10倍。

不使用高精地圖,缺乏先驗資訊,完全依靠視覺感覺,神經網絡占比超過98%的FSD,需要海量的高品質、差異性資料來進化。

是以,在北美資料的“喂養”下,FSD測試版實作了非結構化路段的部分自動駕駛能力,但特斯拉在中國還無法順暢跑通高速路段——目前缺乏使用中國場景資料的能力。

受國家資料安全要求,特斯拉在華資料不能“出國”,這不僅意味着資料本身要存儲在中國的伺服器中,國外IP也不能通過網絡通路,甚至在國内讀取資料的人也有嚴格的國籍背景限制。

這意味着特斯拉要适配中國場景需要在中國“重建”組織。

首先是在中國的資料和研發中心。“負責資料采集和模型訓練,以及産品經理等一系列配套組織,百人以上的團隊。“一位新造車勢力的大資料工程師向《電動汽車觀察家》表示。

還需要重新建構工作流程。因為美國的資料同樣不能進中國,是以隻能從美國傳遞模型參數,而不能傳遞資料本身,“這對模型的訓練工作會帶來很大影響,需要重新在中國搭建訓練用的pipeline(data pipeline:資料的采集、處理、脫敏、清洗、标注、分類和訓練流程)。”上述大資料工程師表示,這又意味着數百甚至上千人的流程團隊。

《電動汽車觀察家》在采訪中了解到,2021年下半年,特斯拉已經開始在中國招聘自動駕駛研發的相關人員,但規模和用途仍不得而知。

而且,像所有跨國組織一樣,海外分支機構從來不隻是錢和人的問題。

“即使所有的研發導入,特斯拉中國和美國研發團隊的融合也不一定那麼順利。” Thoughtworks物聯網業務線總經理朱晨向《電動汽車觀察家》表示:國際研發機構最痛苦的地方在于分支機構和總部的想法不一樣。例如中國的研發團隊根據中國國情做出一些特異化的判斷,送出到總部後是否願意準許。“到底用誰的代碼,以及由此産生的一系列問題。小鵬則無需擔心這些問題。”

XPILOT誕生之初,便是為中國場景服務的。

小鵬采用以高精地圖為綱的決策邏輯,利用高精地圖和多傳感器融合,在感覺和決策算法難度相對較低的情況下實作了高速導航領航這一L3級的進階别智能駕駛輔助能力的落地。

而且中國團隊還能夠針對本地場景進行專門的優化,由此在體驗端超越了特斯拉NoA的在華表現。

據悉,小鵬對識别加塞、大貨車等“中國特色”場景都進行了感覺方面的優化:調整傳感器的布局和感覺範圍;向XP的感覺模型導入更多針對性場景進行訓練。

針對高精地圖“鮮度”不夠的劣勢,小鵬進行了地圖系統的增強:對視覺感覺到與高精地圖不符的新路況,模組化補充進地圖;通過增強算法提升高精地圖的精确性,以更适應道路起伏非常大的場景;通過技術将高精地圖未拍到的細節部補完等等。

值得注意的是,對高精地圖進行增強并不隻是一個技術問題。

2021年,小鵬出資2.5億元收購江蘇智途科技有限公司,獲得了稀缺的甲級地圖資質。不僅使“補完”地圖名正言順,而且還獲得了自建高精地圖的入場券。

小鵬也是首家取得該資質的中國新造車勢力。

02

算法分歧

“每一次硬體的大幅改變,也會帶來軟體算法的大幅改變。”地平線創始人餘凱在演講中表示。

感覺硬體方案帶來的差異是小鵬與特斯拉現階段“分歧”的表象,更深層次的差異來自于不同感覺路線背後“思維模式”的差别——在更遠的未來決定量産自動駕駛這一目标能否最終落地。

“思維模式”即自動駕駛系統的軟體算法。主要分為感覺、決策和控制三部分。

感覺算法追求解決傳感器“感到”的東西是什麼的問題,通過對感覺到的物體進行分類、标注、了解,最終在車端建立起與現實路況高度相似的向量空間;

決策算法則需要綜合考慮導航路線、道路情況、其他交通參與者的動作意圖,以及安全、效率、舒适等行駛标準,在向量空間中先求解出可行空間(凸空間),然後利用優化的方法在可行空間内優化求解,輸出最終軌迹。

控制部分則負責高效協同底盤系統的各個執行件,以便忠實執行決策算法的“決定”。

《電動汽車觀察家》在采訪中了解到,目前的高階駕駛輔助及自動駕駛系統當中,感覺算法絕大多數已采用AI神經網絡進行感覺,決策算法中也已在前端使用神經網絡進行搜尋和選項收斂,後端采用邏輯判斷的算法。

那麼,在純視覺和多傳感器的硬體方案背後,軟體算法的分歧有多大?

2.1 | 感覺算法對比

感覺算法采用神經網絡為主的AI模式已是當下的主流模式。

時間回退至2020年8月,馬斯克首次表示特斯拉正在重寫FSD的基礎架構。一年之後的AI DAY上,特斯拉宣布感覺算法模型中CNN卷積神經網絡的計算量占比達到了98%,并通過RNN(循環神經網絡)加入了時間序列。通過利用具備出色算法并行性的Transformer融合不同攝像頭資料。

直覺來看,就是特斯拉車上8個攝像頭的原始資料進入感覺算法模型,模型輸出時已是時空一緻的結果。最近馬斯克接受采訪時表示,特斯拉已經完成了從視覺到向量空間的完整映射。

目前公開的資訊中,特斯拉的感覺算法模型包含至少48個具體的神經網絡結構,可同時執行超過1000個不同的識别、預測任務,進行一次充分訓練所需要的周期是7萬GPU小時。

相比之下,采用多傳感器融合的小鵬則要在完成視覺感覺算法的基礎上,再走一步。

目前,小鵬P5搭載攝像頭、毫米波雷達、超音波雷達、雷射雷達和高精地圖構成的傳感器方案。其中,雷達的感覺算法相對簡單,高精地圖可提供逾時空的先驗資訊。

特斯拉自動駕駛在中國為何不如小鵬?

多傳感器資料融合過程 《中金 | AI十年展望》

真正的難度在于通過算法模型,将視覺、雷達和高精地圖的資訊進行融合建立向量空間。

由于不同傳感器的探測頻率、資訊類型和精度都各有不同,融合算法模型接收到的是時間不一緻、資訊不一緻、甚至“樣子”都不一緻的傳感器資訊,要将其整合成為時空一緻的向量空間,難度可想而知。

而且,相比于隻靠“看”、資訊一緻的純視覺算法,多傳感器加高精地圖的方案還存在“信誰”這樣的選擇題——“置信”問題。

有專家向《電動汽車觀察家》表示,感覺融合系統的“置信”問題,目前也主要依靠在仿真和真實路況中的第三方資料進行驗證。

小鵬處理的“置信”問題,不是一概而論的。在高速NGP階段,小鵬采用高精地圖為綱的政策,進入城市NGP階段,則将采用視覺感覺為主的方案。

“在城市NGP中,高精地圖仍是非常重要的輸入。但是,由于雷射雷達的存在和視覺感覺能力的快速提升,我們對于各種場景能夠處理得更加安全和自然,在地圖的邊界或是資料出現錯漏的時候,能夠具備更強大的容錯能力。”吳新宙向《電動汽車觀察家》表示,“(随着體系能力的建設),我們有信心趕上甚至超越特斯拉的視覺能力。”

2.2 | 純視覺的“易”與多傳感器融合的“難”

在視覺能力上追上特斯拉,從理論層面來看并不是一句大話。

基于圖像識别的視覺感覺神經網絡擁有“悠久”的曆史,也由此積累了衆多簡潔高效的開源算法。

這是特斯拉敢于公開其感覺算法模型邏輯的原因所在,也成為小鵬要在視覺能力方面趕上,甚至超越特斯拉的基礎。

從目前的結果來看,XPILOT和FSD是目前量産自動駕駛系統中,唯二布局側方(A柱)視角攝像頭的車企。原因便在于,将側方圖像與廣角的前視攝像頭的圖像進行拼接融合的算法,有較高的門檻,尤其是在量産車型上。

做好視覺感覺算法尤為重要。《電動汽車觀察家》采訪的專家普遍認為,視覺感覺仍将是未來自動駕駛系統的核心感覺方案。

但為何還要做多傳感器融合路線?背後的核心是對反應速度和安全備援的極緻追求。

随着攝像頭能力不斷提升,視覺感覺在應對惡劣天氣和路況的能力方面不斷進步。但由于始終存在2D到3D的“翻譯”過程,以及由此帶來的1秒左右的延遲,這對行駛中的汽車來說,有時是緻命的。

特斯拉目前已經通過底層軟體改寫和系統整合,去掉了攝像頭為适應人眼觀看而進行的圖像預處理(LSP)功能,直接将原始資訊傳遞給模型,由此減少8個攝像頭共計13毫秒的延遲。

雷達則能直接給出距離/深度/速度資訊,而且多傳感器的資料可以互相“查漏補缺”。

在P7上形成了自己的感覺架構之後,小鵬在P5上應用雷射雷達,又在G9上将此前的前視線三目攝像頭換成了雙目攝像頭——1個窄視+1個魚眼。

“(随着)XPILOT 4.0的能力更強,對攝像頭分辨率的要求也在提升,是以該攝像頭是在目前三目攝像頭分辨率無法滿足需求的背景下,實作更高分辨率的下一代産品。”吳新宙對此解釋道。

問題在于,目前“市面”上多傳感器融合的開源算法較少。

是以,走多傳感器融合路線,其融合算法将更依賴于各家自研、驗證和疊代,期間必将形成各自不同的風格,但也缺少像視覺感覺“全世界多領域一起加速”的優勢。

而且,目前多傳感器融合路線将導緻車企與供應商強綁定。

與攝像頭擁有标準的資料格式和通用資料接口不同,雷達和高精地圖都還是“非标品”。雷射雷達還存在機械、固态、半固态的路線之争,資料格式和接口尚未形成業内統一的标準。高精地圖也因各家圖商不同,在資料标定方式、精度等方面有所差異。

由此,盡管車企普遍追求軟硬解耦,但事實上在一些具有特殊性的傳感器領域,換供應商便意味着對算法模型的改變。也導緻多傳感器融合路線的車企在供應商選擇方面更為謹慎,不僅建立采購關系,甚至不少還建立了投資、共同研發的深度合作關系。

2.3 | 更難的在于決策算法

解決“感到的是什麼”,建立向量空間還隻是開始。

AI技術在深度學習的加持下感覺能力不斷增長,但仍欠缺“思考”能力:處理如條件機率、因果等複雜關系的能力,完成推理推斷的任務。

這樣的能力,在自動駕駛落地過程中,事關生死。

2018年,Uber的測試車輛出現了全球首例緻死事故。美國官方報告顯示,車輛在事故發生前6秒觀察到了“障礙物”,在前1.3秒判斷出是自行車,需要采取緊急刹車。但“為了降低汽車發生不穩定行為(舒适性不足)的可能性”,自動緊急刹車未啟動,而采取緩慢刹車,加之安全員走神,最終導緻事故發生。

這一案例充分顯示了決策系統的重要性,尤其是在路況複雜,充滿了博弈場景的城市路況中。

通用旗下面向L4級的自動駕駛技術公司——Cruise,在去年的技術日上給出了好決策系統的定義:及時性;互動決策(對其他交通參與者與車輛未來行動及産生的影響進行考慮);可靠性和可重複性(能夠在相同場景做出相同的決策),由此輸出安全、高效,老司機般的乘坐體驗。

特斯拉在此前的AI DAY上明确了其決策系統的标準是安全、舒适、效率;

吳新宙向《電動汽車觀察家》介紹,XPILOT在難度更高的城市場景中的決策要素為:安全、可用性,以及好用性。

标準類似,但是要實作老司機般的操控表現卻非易事。

在低速或簡單場景下,決策算法會根據感覺資料規劃出一條無碰撞的安全路徑,車輛按照指定路線運動。

但複雜的交通流和場景路況中,常會出現規劃軌迹跳變、碰撞等問題。核心是由于決策算法對障礙物未來行為的預見性不足,算法僅依靠目前時刻的感覺資料進行局部、而非全局路況求解導緻。

是以,當車輛處于陌生又複雜的場景中時,往往會反複緊急制動或出現危險動作,“安全、高效、舒适”的決策标準很難滿足。

車輛進行自動駕駛時,一般一個交通場景中可能有上百個交通參與者與自動駕駛車輛發生互動,決策系統需要考慮場景中其他交通參與者未來的動作,投影預測的社會車各種行為,行成一個可行駛空間,然後搜尋出軌迹。

其中,預測被認為是自動駕駛系統工程落地中最困難的一環。車輛不僅要了解自身與環境未來可能的各種動向,還要從無數可能中判斷出最有可能的交通參與者行為。

為建立系統的預測能力,業内目前除不斷地優化算法之外,還需要對AI在世界模型中進行自我監督學習。而特斯拉通過影子模式收集的、真實世界中海量的交通參與者行為,則成為FSD建立預測能力最好的教材。

去年的AI DAY上特斯拉展示過一個窄道會車的場景。自動駕駛車輛在開始時認為他車會繼續行駛,是以靠右等待,發現他車也停下讓行後,立刻前進了。

特斯拉自動駕駛在中國為何不如小鵬?

特斯拉自動駕駛車窄道通行案例,AI DAY

對此,一位自動駕駛規控工程師向《電動汽車觀察家》表示,目前大多數自動駕駛公司無法處理這樣的場景,往往會保守地選擇停車讓行,或與他車同起同停,造成碰撞風險。“但特斯拉可以很好的處理該場景,證明它的預測和決策配合非常好。”

即使有了“預測”,“搜尋”也不容易。

自動駕駛車輛通常需要采樣計算5000多條備選軌迹才能做出正确的決策。

但“時間不等車”,決策規劃算法通常運作頻率在10Hz-30Hz左右,即每30ms到100ms就需要計算一次,而在這麼短的時間做出正确的決策是一個巨大的挑戰。

特斯拉FSD目可在1.5ms搜尋2500次,通過對備選軌迹綜合評價後選擇最優軌迹。

但這樣的做法在人車混流、道路結構複雜的城市路況中往往會導緻超算(超出計算平台的算力能力)。

為此特斯拉引入了MCTS架構(蒙特卡羅樹搜尋),相較傳統搜尋方式效率提升了100倍以上。

MCTS可較為有效地解決一些探索空間巨大的問題,例如一般的圍棋算法都是基于MCTS實作的。蘋果自動駕駛專利和谷歌的阿爾法狗都有采用該方法。

特斯拉自動駕駛在中國為何不如小鵬?

小鵬XPILOT道路互動

目前,小鵬尚未透露其決策算法所利用的模型類型。不過吳新宙向《電動汽車觀察家》表示,在城市場景,由于交通參與者的不同和場景的複雜程度,對于預測、規劃和控制有完全不一樣的要求。是以,小鵬對定位、感覺、融合能力是在高速場景的基礎上做了大幅增強。

“對于決策部分,我們引入了一套全新的架構,來滿足城市NGP更高的要求。這部分架構也有非常強的反向相容性,是以我們也期待未來在XPILOT 3.5上,我們的高速和停車場場景也能受益于這套新的架構,給使用者更好的體驗。”

03

小鵬如何在全球追趕特斯拉

特斯拉FSD早晚在中國開放,而小鵬汽車智能駕駛也要走出中國。兩方早晚正面對戰。小鵬能否在東半球,乃至全球和特斯拉一戰?

真正給何小鵬叫闆特斯拉信心的,是小鵬汽車從2020年完成的端到端全棧自研體系能力。

3.1 | 打造自己的算法資料閉環

何為全棧自研?

吳新宙向《電動汽車觀察家》表示:小鵬汽車的“全棧自研”不僅是自研車端的視覺感覺、傳感器融合、定位、規劃、決策、控制等方面(的算法)。

還包括雲端資料營運所需的一系列工具和流程。

即資料上傳通道、前端資料上傳實作、雲端資料管理系統、分布式網絡訓練、資料采集工具開發、資料标注工具開發、軟體部署等方面實作自研。

“由此形成資料和算法的全閉環,為快速的功能疊代打下堅實的技術基礎。”

差別于邏輯判斷算法模型依賴于工程師有多聰明,自動駕駛系統主要采用的神經網絡算法模式具有“基于資料成長”的特性:算法是在前期資料收集、中間資料存儲與遷移,後期核心資料的訓練與管理,所形成的資料流中逐漸成熟的。

算法由資料推動疊代,疊代算法又帶來新的資料,系統能力的提升本質上是在資料中循環往複的過程。

在這一成長閉環當中,任何一個環節加以他人之手,都将影響企業“自己的”自動駕駛系統疊代更新的速度和品質。

此前傳統汽車産業中是沒有“自己的”節奏的。主機廠雖然占據産業鍊的強勢位置,但車型疊代周期更多受限于零部件供應商技術和商業的節奏。直到特斯拉打破了這一行業慣例。

特斯拉自動駕駛在中國為何不如小鵬?

特斯拉AP更疊曆史 資料整理:《電動汽車觀察家》

2016年6月發生的Model S死亡事故中,何時通過視覺方案實作AEB(緊急制動)的時間分歧導緻了特斯拉與Mobileye徹底“分手”。

對于事故車輛沒有啟動緊急制動(AEB)功能,Mobileye首席通信官DanGalves發表聲明稱:“目前(2016年)AEB被歸入躲避追尾事故系統,(因而無法應對前方橫向出現的車輛)。不過Mobileye将會從2018年開始帶來道路側向轉彎(LTAP)檢測功能。”

但特斯拉即不願意等到2018年,也不願意走Mobileye所擅長的傳統視覺感覺路線。

于是,才剛成立一年的特斯拉視覺感覺自研軟體算法小組Autopilot Vision(TV)和機器學習小組,在2016年10月“強行”頂替了Mobileye的位置,并在年底确定了AI視覺感覺的技術路線。

上線之初,TV并未完成AP軟體端所有的應用開發,包括 AEB、防碰撞預警、車道保持、自适應巡航等關鍵功能缺失數月之久,還用毫米波雷達幹了一段時間AEB的“活兒”,導緻衆多“幽靈刹車”的案例産生。

直到2017年4月,特斯拉推送V8.1,自研的AI視覺算法能力追上了Mobileye為支撐的HW1.0時代,就此開啟了汽車産業從未有過的疊代速度,并“逼迫”全行業“追趕”起了特斯拉的節奏。

小鵬是全行業第一個從全棧自研,而非僅僅是功能層面,追趕特斯拉節奏的車企。

2018年,通過小鵬G3,XPILOT 2.0 正式産品化落地,實作了端到端自研資料閉環的自動泊車系統量産;

2019年在小鵬G3i上搭載的XPILOT 2.5 系統在泊車之外,實作了ALC自動變道功能。其中,小鵬自主研發了最底層的線控、路徑規劃和控制部分算法,感覺算法仍依賴于供應商提供;

2020年,小鵬P7和XPILOT 3.0一同亮相,可實作NGP和停車場記憶泊車功能,至此小鵬第一次完成了深度的軟體全棧自研,建立了自己的視覺感覺能力、驅動感覺進化的資料閉環體系、高階輔助駕駛算法和軟體架構的落地,成為全球第二家實作自動駕駛系統全棧自研,算法、資料閉環的車企。

“與非自研相比,采用‘全棧自研’模式在組織、人才、研發投入上肯定都更重,但是優勢也是顯而易見的。”吳新宙表示。

3.2 | 掘金全棧自研

優勢确實顯而易見。

僅從高速導航領航功能來看,小鵬NGP于2020年落地;蔚來雖然略早幾個月,但仍是基于Mobileye半自研産品;理想則在2021年9月更新後才将該功能落地。

而包括極氪+Mobileye(ZAD)、極狐華為HI 版(華為 ADS)、智己汽車+Momenta(IM AD)、哪吒汽車(華為+地平線)、零跑汽車(Leap Pilot)等品牌雖然都有L3級高階智能駕駛能力的計劃,但仍與小鵬存在相當的時間差。

跟“自己比”,小鵬也進步迅速。

特斯拉自動駕駛在中國為何不如小鵬?

小鵬XPILOT系統更疊情況 資料整理:《電動汽車觀察家》

2020年,小鵬P7在自研方案之外,還采用了1個前置攝像頭和一個英飛淩Aurix MCU 2.0為主的智能控制器作為備援方案,其感覺和決策算法也來自博世。到2021年的P5身上,這套來自第三方的備援方案被取消了,P5隻了搭載英偉達Xavie平台,而且增加了雷射雷達作為傳感器。

按照計劃,小鵬将在算力為30TOPS的英偉達Xavie平台上實作XP3.5最核心的城市NGP功能。同樣實作這一高階駕駛輔助功能的特斯拉FSD晶片算力則為144TOPS。

“(全棧自研)鍛煉了團隊的極緻工程能力,在有限的算力下實作了相對複雜的功能落地。”吳新宙向《電動汽車觀察家》表示:“從XPILOT 3.0到3.5,再到未來的4.0和5.0,小鵬的技術路線是非常有延續性的自然演進。”

3.3 | 效率競争

殊途同歸。小鵬雖然已經走上了與特斯拉頗有分歧的技術路線,但兩者的路徑和目标卻是一緻的:通過全棧自研,實作量産自動駕駛技術。

在吳新宙看來,面向這一目标的較量其一在于資料量,其二則在于正确的網絡架構。

“特斯拉目前的網絡架構,對于體系能力有很高的要求,無論從資料的擷取,标注和訓練來看,其它廠家在體系能力的建設和投入上和特斯拉有巨大的差距。”

資料量方面,特斯拉目前在全球範圍内無人能敵。

特斯拉人工智能總監Andrej在CVPR(IEEE國際計算機視覺與模式識别會議)2021上表示,截至2021年6月底,特斯拉擁有百萬量級的車隊,已經收集了100萬個36幀10秒時長的高度差異化場景視訊資料,約占用了1.5PB的存儲空間。獲得了60億個包含精确深度、加速度的物體标注,共進行七輪影子模式疊代流程。

這一資料規模,不僅小鵬與特斯拉相去甚遠,即使是一衆自動駕駛公司也難望其項背。去年10月,Waymo公布的最新資料中,累計路測裡程達到1000萬英裡。特斯拉截至去年6月的資料則為近1500萬英裡,其中170萬英裡在Autopilot啟動情況下收集。

資料是自動駕駛系統算法模型疊代成長的燃料。而特斯拉已建造了一套高效的資料閉環體系,将這些海量資料加工成“無煙煤”。

特斯拉自動駕駛在中國為何不如小鵬?

特斯拉資料生産的三個階段 《中金 | AI十年展望》

在百萬輛級的車隊基礎上,特斯拉通過“影子模式”有針對性地搜集海量corner case(罕見特殊的長尾場景)場景資料,以及人類司機在該場景下的操作資料為神經網絡提供品質更高的半監督學習或監督學習引導;

這些原資料需要被标記出各類特征之後,才能作為神經網絡的學習素材。

此前,這類非結構化資料依賴大量人工标注,屬于勞動密集型産業,各企業多将工作外包給第三方。但第三方标注具有效率低、回報慢等痛點,導緻标記、分析、處理訓練資料的延遲較高。

特斯拉自建超過一千人的資料标注團隊,分成人工資料标注、自動資料标注、模拟仿真、資料規模化四個團隊,技術層面已經完成了從2D标注到4D标注和自動标注的進階,自動标注工具可以通過一次标注就實作所有攝像頭多視角、多幀畫面同步标注,同時也能就時間次元進行标注。

自建資料标注體系之後,特斯拉還自建了資料的訓練場——由3000個特斯拉自研Dojo D1晶片組成的算力高達1.1EFLOP的超算叢集,與與谷歌(1 EFLOP)和商湯(1.1 EFLOPS)同為當下世界第一的算力梯隊。

而且相比谷歌、商湯的通用性超算叢集,Dojo在設計上更專注于視訊處理,對特斯拉自動駕駛系統模型訓練更具有針對性,并由此有效降低算法成本。

“我們認為,體系的差距比資料的差距更重要,小鵬過去幾年一直緻力于自己的體系能力建設。複雜系統工程在終端呈現的結果也并不是單一變量決定的,還是要看整體設計與硬體比對的程度。

後續,我們也會持續在算法優化和傳感器選型或者變更上做好平衡,用合适的硬體做出更高階的輔助駕駛能力,并持續向自動駕駛演進。”吳新宙向《電動汽車觀察家》表示。

3.4 | 小鵬的機會點

效率和成本,是任何産品能夠成功實作大規模量産的決定性因素。而特斯拉建設這套增效降本的資料閉環體系不僅依仗自身的技術能力,而且也與其強大的資金實力息息相關。

2021年,特斯拉的研發費用約為168億元(25.91億美元,6.5人民币/美元)。相比之下,小鵬為41.14億元,長城為90.7億元。

但這并不意味着小鵬在與特斯拉量産自動駕駛的下半場競賽中全無勝算。

朱晨向《電動汽車觀察家》表示,相比于特斯拉完全從技術公司的角度出發的産品思路,小鵬在推出産品功能時候,更多思考的是能否結合中國的适用場景,真正給車主的生活帶來幫助。

而更适合中國使用者需求的功能則有助于小鵬在中國銷量的規模化,進而實作真正意義上,XPILOT的量産落地,并幫助其建立起中國場景下的資料及體系優勢。

2020年,FSD(特斯拉完全自動駕駛系統)在華購買率隻有1-2%,低于北美10%-15%的比例(外媒測算)。2021年Q4,Model 3車型上的FSD搭載率,在亞太地區為0.9%,歐洲和北美則分别為21.4%和24.2%。(長期關注特斯拉的部落客Troy Teslike統計資料)

特斯拉自動駕駛在中國為何不如小鵬?

小鵬XPILOT落地情況,2021年Q3

截至去年三季度末, 與特斯拉Autopilot 加強版功能相似的XPILOT 3.0激活率近60%。吳新宙未透露小鵬的資料擷取模式,但表示“世界的先進經驗都會學習。”

在算力和道場方面,小鵬目前可借助的“外力”絲毫不弱。

小鵬G9将搭載XPILOT 4.0,其上應用508 TOPS的 英偉達 Orin-X晶片,和千兆以太的高度內建域控制器。而且英偉達今年釋出的AI訓練伺服器EOS算力高達18.4 EFLOPS。

而且小鵬相較于特斯拉對場景的把握能力已經開始顯現。

今年3月,小鵬汽車推送了Xmart OS 3.1.0版本,實作了長達2公裡的VPA-L跨樓層停車場記憶泊車功能。幾乎是同期,坊間傳言特斯拉正在研制“Smart Park”:在有司機的前提下,車輛自動停在“最接近門邊”、“在購物車出口附近”、“停車場末端”等指定位置。從功能描述上,Smart Park與記憶泊車非常類似,領跑者與追趕者位置倒置。

在更遠的海外,正如何小鵬此前所說:“我們會相遇的。”

本文鳴謝(首字母排序):

阿寶1900自動駕駛專家

迪迪自動駕駛資料工程師

吳新宙小鵬汽車自動駕駛副總裁

自動駕駛拖拉機決策規劃算法工程師

朱晨Thoughtworks物聯網業務線總經理

參考資料:中金《軟體及服務 | 人工智能十年展望》

——END——

繼續閱讀