天天看點

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

作者:汽車族

從2023年ChatGPT的橫空出世,再到今年Sora模型的誕生,端到端大模型在多個領域都展現出了其強大的潛力,在汽車行業中亦是如此。

何為“端到端”

在深度學習領域,"端到端"通常指的是隻需輸入原始資料就能直接輸出最終結果的AI模型。通過大量高品質資料進行訓練,端到端大模型能夠逐漸提升其智能水準。在汽車行業中,該技術可應用到自動駕駛領域,進而取代傳統自動駕駛技術。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

傳統的子產品化自動駕駛系統通常将感覺、決策和控制分為獨立的子產品,每個子產品專注于解決特定的問題,這樣的分工簡化了系統開發的難度,利于問題回溯與研發疊代,為目前的主流方案。

然而,這種方法的缺陷在于,人工程式設計的代碼隻能處理有限的行車場景。無論給系統添加多少行代碼,也無法覆寫到所有的特殊情況,是以難以實作完全自動駕駛。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

相比之下,端到端大模型是一個整體,更接近人類駕駛的模式。不再試圖通過人工程式設計來處理每一種行車場景,而是使用大量資料進行訓練,讓AI自己發現資料之中隐藏的行駛規則,這樣就能夠覆寫更廣泛的行車場景,有望實作完全自動駕駛。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

然而,當下的端到端大模型存在着令人難以了解的缺陷。即使經過大量訓練,大模型在某些場景中仍可能變為“人工智障”,所采取的決策遠不如人類。同時,端到端大模型的決策過程具有“黑箱”特性,内部邏輯不公開,決策中所出現的問題難以被定位,給研發疊代和問題解決造成負面影響。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

此外,資料量、算力以及對大模型的精簡優化都是推進端對端大模型發展的重要因素。

首先,自動駕駛系統需要大量的高品質訓練資料。這些資料包括各種駕駛場景、天氣條件和交通情況的圖像、視訊和傳感器資料。收集、标注和維護這些資料的品質和多樣性是一項挑戰,尤其是要確定資料能夠覆寫所有可能的駕駛場景。馬斯克曾表示:“特斯拉花了大約一個季度的時間完成了1000萬個視訊片段的訓練。訓練了100萬個視訊case,勉強可以工作;200萬個,稍好一些;300萬個,就會感到Wow;到了1000萬個,它的表現就變得難以置信了。”

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

其次,将海量資料喂給端到端大模型時,算力是不可或缺的資源。智算中心需要進行擴建,才能滿足日益增長的算力需求。

最後,當雲端的大模型訓練完成後,需要對其進行精簡。雲端伺服器擁有大量高性能硬體資源,支援大規模并行處理資料并進行資料存儲。但車載計算資源有限,為了與之适配,需要對模型進行優化,并降低能耗。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

特斯拉的端到端大模型與算力部署

特斯拉在端到端大模型領域中處于領先地位。2023年8月,馬斯克在直播中展示FSD V12 Beta版本,多次強調該版本使用海量視訊資料進行訓練,駕駛決策由AI算法生成。并且,他還在X上釋出推文,表示V12 Beta版本大幅縮減了人工程式設計的C++控制代碼,從 30 萬行下降了2個數量級(變為3000行)。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

今年3月,北美地區的特斯拉非員工使用者陸續收到FSD V12.3版本的推送。該版本在面對障礙物和變道博弈等複雜場景表現更出色,但在處理一些簡單場景時,例如在空曠的路面上行駛,會出現離譜的加速或減速問題。

在算力方面的規劃上,特斯拉在去年部署了超過10EFLOPS的算力,并預期将于今年末達到100EFLOPS。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

造車新勢力的端到端大模型與算力部署

國内造車新勢力紛紛跟進FSD V12,但目前還沒有實作量産上車。在今年1月的全國智駕啟動釋出會上,何小鵬表示,小鵬汽車将實作端到端大模型全面上車。據悉,理想的新模型也将在今年上線,而蔚來将于年内上線基于端到端的主動安全功能。

同時,三者在智算中心方面均有所布局。

小鵬與阿裡雲共建了扶搖智算中心,訓練算力為600PFLOPS(0.6EFLOPS)。

理想汽車和火山引擎共建的智算中心,訓練算力為1200PFLOPS(1.2EFLOPS)。

蔚來內建阿裡雲、英偉達等合作夥伴的技術資源,建設了蔚來雲智算中心,算力為1400PFLOPS(1.4EFLOPS)。

【技術】汽車端到端大模型:AI對駕駛規則的深度學習

結語

汽車端到端大模型展現出了不俗的潛力,但目前還不成熟,需要安全政策進行兜底。不過不用擔心,它的成長之旅才剛剛開始。随着對算法和硬體的不斷優化,以及使用更多資料進行深度學習,端到端大模型将逐漸完善并在自動駕駛中得到廣泛應用。

繼續閱讀