天天看點

智能駕駛開「卷」端到端,誰能摘到皇冠上的明珠?

作者:雷峰網

北京車展仍在繼續。

和2023年的上海、廣州車展一樣,智能駕駛依舊是這次車展繞不開的主題,但同時市場也在迅速變化,技術疊代的速度正超乎所有人的意料。

“從去年的上海車展到今年的北京車展,智能駕駛的發展突飛猛進,連我自己都被驚訝到。”

理想汽車智能駕駛副總裁朗鹹朋博士在北京車展期間地平線的生态圓桌論壇上講道,“去年大家還在講高速NOA、講Transformer 和BEV,今年行業卻已對城市NOA司空見慣,幾乎都在講無圖方案和端到端。”

一個更明顯的變化是,智能駕駛的核心正回歸至消費者本質——更好用、更拟人、更安全,為了提高L2+級智能駕駛功能的市場滲透率,如今行業關于城區NOA的規模化較量,正從比拼開城速度轉向比拼日活。

而日活,将成為衡量城區NOA是否好用的關鍵名額,消費者對于智駕功能的實際體驗評價、喜好也正被各車企放至愈加重要的位置。

然而一個問題是,從實際體驗來看,城區NOA目前尚未達到使用者眼中“可用”标準,距離“愛用”更是相距甚遠。

“城區NOA真正做到讓消費者願意用是很難的。目前城區NOA的激活時間其實還是非常低的。”元戎啟行CEO周光則如此表示,“就算是願意用了,但很多時候,這些功能給消費者帶來的是驚吓,而不是驚喜。可能一次(不順利的體驗)就會讓消費者戒掉。”

從“可用”到“好用”,高階智駕的路還要走多久?如今衆多車企與Tier1們幾乎無人不談的端到端會是這個轉折點的答案嗎?端到端量産落地的最佳解法又會是什麼?

高階智駕“開城大戰”内卷加速:使用者體驗仍是“痛點”

各家車企關于高階智駕“開城大戰”的火藥味一路蔓延到了北京車展中。

“城市NOA在全國都能開我們肯定是第一,我們的目标是到今年年内,在國内大部分地區甚至小區内都可以開。”小鵬汽車CEO何小鵬在北京車展接受新智駕等媒體采訪時如此表示。

小米汽車首次參展即虹吸巨大流量,雷軍在車展上自信喊話,“小米SU7的高速NOA絕對可以媲美華為、小鵬。”同時雷軍還宣布,小米SU7的城市NOA将會在5月份開始推送。

與此同時,仰望汽車的仰望U7将在今年第三季度開通城市領航功能、魏牌的藍山智駕版将在5月進行大規模NOA試駕體驗、極越汽車計劃在今年實作城市NOA覆寫全國......

從時間節點看,國内一衆新能源品牌正在進入高階智駕“全國都能開”“有路就能開”的規模化量産新階段。

然而實際上,這兩年車企在大規模落地高階智能駕駛方案時卻遇到了不小的挑戰。

在中高階智駕方案,由于技術的不成熟,本應給消費者帶來極緻體驗的功能卻無法發揮出應有的效果,進而吸引消費者買單。

麥肯錫在《2024麥肯錫中國汽車消費者洞察》報告中指出,消費者對各類自動駕駛功能的興趣正在提升,但願意為之額外付費的意願卻在下降;其中一線城市的付費意願下降尤為明顯。

事實上,雖然目前城區NOA功能上車已久,各家車企對城區NOA功能的落地和推廣也都相當看重,但從市場回報的情況來看,大多數車企的城市NOA仍處于起步階段,尚且無法滿足使用者的智駕需求,要麼适用場景有限,要麼駕駛體驗不佳,難以稱得上好用。

地平線就在這次的北京車展上指出,智駕系統将經曆從可用、好用到愛用的三個發展階段:

智能駕駛開「卷」端到端,誰能摘到皇冠上的明珠?

•可用:以滿足實體名額為目标,聚焦場景通過率、通勤效率等實體名額,但在體驗上要麼“慫”要麼“莽”,隻能達到“可用”的标準。

•好用:在實體名額基礎上,以達到拟人化體驗為目标,聚焦實作更優雅從容随時可激活的體驗,達到使用者心中“好用”的标準,真正改變消費者的認知。

•愛用:以達到智駕平權為目标,聚焦通過極緻的應用和量産效率,讓高階智駕體驗人人可及,真正讓每個消費者“愛用”。

而當下量産的以城區NOA為代表的高階智駕系統尚未充分達到使用者眼中的“可用”狀态,城市NOA目前的“慫”“莽”“急”“貴”四大問題成為阻礙消費者為之付費的關鍵因素:

1.慫:擁堵更添堵,導緻體驗接管;

2.莽:搶行太莽撞,導緻安全接管;

3.急:為快速開城,系統可用性下降;

4.貴:不利于功能普惠與大規模市場落地。

以MPI為例,目前使用者在開啟城區NOA功能時,基本幾十公裡就得人工接管一次,離達到“輕松好用”相去甚遠,以路口轉彎這類典型高頻場景為例,目前使用者在開啟城區NOA功能時,通常都會因為系統fullstop或軌迹生硬而選擇接管,離達到“輕松好用”相去甚遠。

使用者體驗不佳,再加上成本過高、全場景NOA受高精地圖覆寫限制,城區NOA功能僅能在有限的、少數高線城市開通,且過于激進的去高精地圖也一定程度帶來了系統性能下降,經常随機出現各種退功能問題,使得這些功能的實際使用者使用頻率并不高,進而進一步造成功能疊代開發難度大、周期長的問題。

要想進一步提高智能駕駛的市場滲透率,2024年,智駕功能的改善和疊代必須轉向實用與場景優化,以“使用者粘性”作為自身核心競争點。

而在價格戰愈加白熱化的當下,如何在有限的成本下實作更好的功能體驗,又如何讓下一代高階智駕系統兼顧通行效率和拟人化體驗?

地平線認為,技術重構是實作全場景高階智能駕駛系統量産的唯一途徑。

2023年特斯拉公布FSD V12版本,将城市街道駕駛堆棧更新為端到端神經網絡這一技術路線,由此一股名為“端到端”熱潮開始席卷國内智駕圈,在今年的北京車展上,更是逐漸升溫,成為各車企和Tier1們口中放不下的關鍵字之一。

從“能用”到“好用”的跨越:端到端開啟下一個洗牌局

所謂端到端,指的是一種新型的AI模型,采用BEV+Transformer技術架構等方式來實作感覺決策一體化,以達到輸入原始資料後便能輸出最終執行指令的效果。這項技術令該版本比以往減少了數十萬代碼,讓汽車在沒有資料連接配接的情況下仍可在不熟悉的路段地形上行駛。

一位算法方案開發工程師曾對新智駕指出,“将感覺與決策融合到同一個模型中,使得端到端模型能有效避免聯級之間的誤內插補點,無需任何人工規則介入,更加接近人類駕駛行為的高階智駕。”

2023年,特斯拉FSD V12展示了端到端模型上車的效果後,國内主流車企與Tier1意識到這是一個未來趨勢,開始快馬加鞭地追趕。

在過去,智能駕駛從業者大多将整個自動駕駛任務劃分為感覺、預測、決策、控制等子產品,由于每個子產品的技術棧相差很大,且難度高,是以每個工程師都獨立負責其中一或兩個子產品。

是以目前已量産的智駕模型,也大多采用傳統子產品化的架構,即按照感覺、預測等功能來劃分成不同的多個小模型,每個模型都要單獨對其進行訓練和優化,且下遊規控環節仍以規則為主。

與傳統子產品化架構不同的是,端到端模型是由多個小模型(即神經網絡)級聯而成,并且隻需通過訓練這一個大模型,就能達到優化和提升各個功能子產品的能力,進而減少傳統架構下對逐一子產品訓練所帶來的研發成本。

智能駕駛開「卷」端到端,誰能摘到皇冠上的明珠?

(新智駕整理制圖)

技術落地大戰爆發前夕,搶先一步的是學術預研。

學術界對端到端的研究始于1988年的ALVINN,随後發展出端到端CNN原型系統。

地平線則早在2016年便率先提出了自動駕駛端到端的演進理念,并在2017年就開始采用訓練端到端系統,同時釋出軟體架構Hugo。

2022年,地平線又提出行業領先的自動駕駛感覺端到端算法Sparse4D,2023年,由地平線學者一作的業界首個公開發表的端到端自動駕駛大模型UniAD,榮獲CVPR 2023最佳論文。

論文中, UniAD 架構被首次提出,成為業界首個感覺決策一體化的自動駕駛通用模型。

基于此,研究人員将感覺、預測和規劃等三大類主任務、六小類子任務(目标檢測、目标跟蹤、場景建圖、軌迹預測、栅格預測和路徑規劃)整合到統一的基于 Transformer 的端到端網絡架構下,實作全棧關鍵任務駕駛通用模型。

與此同時,地平線還積累了基于蒙特卡洛樹搜尋的端到端深度學習算法,大幅提升了智駕系統在複雜交通環境中的感覺和互動式博弈能力。

一業界高管向新智駕透露,“實力強的企業将有望在1-2年内推出端到端模型,慢慢地,供應商與正常企業也會跟進,這是一個可以确定的趨勢。”

比如在2023年12月,理想汽車完成了OTA5.0更新。從釋出的 AD Max 3.0 來看,在端到端架構的支援下,理想汽車整合了BEV大模型、MPC模型預測控制以及時空聯合規劃等能力,還新增了Occupancy占用網絡算法。同時,理想還利用自研的神經先驗網絡NPN(NeuralPriorNet)為BEV打“更新檔”。

此外,為了處理複雜的交通紅綠燈資訊,理想汽車曾表示,其采用信号燈通行意圖網絡TIN(Traffic Intention Net)來解決,而TIN正是端到端模型。

何小鵬也在這次的北京車展上透露,小鵬汽車将在第二季度上車端到端大模型AI智駕,這一大模型的應用将過去基于圖檔的算法架構,轉為視訊流。

在各家競相追逐端到端模型上車之際,業界被反複追問——端到端模型是否會成為高階智能駕駛的技術終局?

業内人士向新智駕表示,智能駕駛技術最終的發展方向應是更貼近人類開車的行為模式,至少與人類駕駛行為相似的子產品之間具有更強更緊密的關聯。

在他看來,高階智能駕駛最終的技術架構應是完全端到端的方案,以攝像頭、毫米波雷達、雷射雷達等多傳感器、多模态的輸入,作為端到端的輸入端,車輛的控制指令成為輸出端,跳過了中間的定位、預測、規劃、決策等子產品,隻有輸入和輸出這兩端,這是将來的技術架構。

綜合來看,端到端的路線意味着系統更大的部分是由資料驅動的子產品所建構,那麼就意味着由人所維護的子產品相應的比例會降低,那麼這樣的話,整個系統就更容易維護。

且端到端架構通過一個模型實作多種模型的功能,研發人員隻需要針對這一個模型進行整體訓練、調整優化,即可實作性能上的提升,是以可以更好地集中資源,實作功能聚焦。

更關鍵的是,端到端模型方案的潛力在于擁有更高的性能上限。由于任務更少、避免了大量重複處理,端到端自動駕駛可以提高計算效率,并且可以通過不斷擴充資料來提升系統的能力上限。

功能聚焦、易維護、擁有更高性能上限、更接近人類駕駛行為......端到端系統無疑是驅動城區NOA邁向“好用、愛用”的最優實作路徑。

而随着端到端系統的加速落地,行業關于高階智能駕駛的比拼也将迎來新節點。

事實上,端到端自動駕駛技術目前存在的發展瓶頸仍然是傳統的三大問題——算法、算力和資料。

其中算力平台需要支援更大規模的端到端的自動駕駛系統裡面的網絡;資料層面需要有海量的、非常多樣性的,能夠覆寫普通使用者生活場景中絕大部分 case 的資料;而算法方面則需要探索可解釋、可幹預性強的端到端自動駕駛系統。

誰能率先打通這三大關卡,無疑誰就能在這場關于端到端的洗牌局中更擁有走到最後的底氣和決勝牌面。

端到端量産落地之路:軟硬協同是最佳解法

這意味着,各行業玩家們必須解決複雜嵌入式計算機系統技術和極緻工程能力的雙重挑戰,做到軟硬體高效協同。

這一方面需要各企業不斷拓展ODD,需要在盡可能大的地域空間及各種天氣條件下實作盡可能高的産品性能。

另一方面還要提升功能的性能和體驗,實作NCA、ICA+、ICA、VPA、APA等工作模式并無縫切換,并且每個模式的系統性能都要打磨到最優以提升系統處理hard case的能力。

目前行業裡的玩家在落地高階智駕時通常有兩種類型的技術政策。

第一種是側重于功能體驗和性能的提升,但是ODD的拓展做得不夠,依然非常狹窄;第二種是側重于拓展更廣的ODD,但是功能水準卻非常狹窄和有限。

要想二者兼顧,需要開發者同時具備很強的軟體與硬體能力,以及極緻的工程能力,同時在兩個次元實作突破。

事實上,更高端的計算方案和傳感器等硬體配置,決定了性能的下限,更先進的軟體技術架構,則決定了性能的上限,軟硬協同無疑是當下實作端到端高效量産落地的最佳路徑之一。

而在地平線創始人餘凱看來,軟硬協同是地平線的獨特優勢,依托領先的前沿軟體算法研究,去設計最先進的硬體計算架構,然後支援最先進的算法,使晶片架構與應用軟體配合得嚴絲合縫,能使計算方案效率非常高。

而在這次的北京車展上,憑借前沿的端到端軟體算法技術,地平線釋出結合端到端技術的量産級高階智能駕駛系統SuperDrive,就試圖提供打造“好用”智駕方案的解法。

一方面,SuperDrive通過三網合一的感覺端到端架構,将智駕系統的遮擋準召率提升70%,對目前行業感覺架構時延高、規則多、負載重的問題進行了有效解決。

另一方面,SuperDrive通過資料驅動的互動博弈大幅提升了智駕系統在複雜交通環境中的感覺和互動式博弈能力,做到在擁堵場景下變道成功率提升50%,路口通行效率提升67%。

同時,SuperDrive還具備無高精地圖的感覺能力,能做到對高精地圖輕依賴,進而快速上線各城市NOA功能,做到高效拓城。

在計算方案層面,SuperDrive則與征程6旗艦版協同,試圖打造出最佳的軟硬結合高階智駕系統,讓好用的城區NOA方案加速規模化量産落地,實作人人可及。

事實上,除了SuperDrive這套城市NOA方案,在北京車展上,地平線還釋出了業内期待已久的征程6智能駕駛計算方案。

智能駕駛開「卷」端到端,誰能摘到皇冠上的明珠?

征程6系列共推出六個版本,包括征程6B、征程6L、征程6E、征程6M、征程6H、征程6P,其中征程6旗艦版——征程6P,算力560 TOPS,面向的就是高階智駕市場,其擁有高內建度、高算力、高效率、高處理能力、高接入能力以及高安全等六大産品特性。

根據介紹,單顆征程6旗艦即可支援感覺、規劃決策、控制等全棧計算任務,支援全場景NOA功能。

與此同時,征程6P還在高性能的前提下做到了高成本效益,基于征程6P的硬體系統成本可以做到1萬元以下。

另一方面,Transformer也是實作端到端自動駕駛的重要技術。

如果把端到端比作高階智能駕駛要前往的終點,BEV+Transformer更像是旅途中的一座橋梁,也可将其視為一種工具,而Occupancy占用網絡則是一種可疊加使用的輔助“武器”。

而地平線無論在算法上還是計算方案上,都實作了對Transformer的最佳支援。

在算法層面,UniAD是行業首個感覺決策一體化端到端模型,在nuScenes所有任務上都達到了最佳性能。

地平線的純視覺自動駕駛算法Sparse4D則是其接棒BEV+Transformer的下一代架構。在今年1月份,地平線還将Sparse4D系列算法開源,以推動行業更多開發者共同參與到端到端自動駕駛、稀疏感覺等前沿技術方向的探索中。

在硬體層面,地平線新一代BPU納什架構,原生支援大參數量Transformer模型,并提供業内同級最強的Transformer計算性能,為先進的端到端系統的部署提供有力支援。

而在相關技術棧方面,地平線搭建的促進軟體開發和定制的各種工具,諸如算法開發工具鍊天工開物、嵌入式中間件踏歌、軟體開發平台艾迪等等,也展現了其強大的軟硬體綜合能力。

更低成本、更高性能上限、更高效協同的全棧式軟硬體能力,讓高階智能駕駛系統SuperDrive+征程6旗艦版的協同指向了一個終極方向——幫助産業玩家更高效地實作基于端到端模型的高階智駕大規模量産落地。

據地平線透露,在合作車企方面,地平線的SuperDrive方案已經與多家車企和頂級Tier 1達成合作,預計到今年第四季度将會有标準量産方案推出,而到明年第三季度,首款搭載SuperDrive方案的車型也将進入傳遞期。

從可用到好用,國内的汽車高階智能駕駛之路剛剛走向轉折點,要想在關于端到端這場火熱的戰事中勝出,作為國内智能駕駛方案的頭部供應商,地平線的征程剛剛開始。

雷峰網#雷峰網#雷峰網