天天看點

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

作者:景氣度觀察

(報告出品方/作者:中信證券,連一席、沈思越)

複盤:英偉達通用型 GPU 先聲奪人,地平線把握時 間視窗進行國産替代

背景:汽車 EE 架構向集中化演進,催化智駕 SoC 晶片需求

汽車電子電氣(E/E)架構從分布走向集中,自動駕駛晶片以 SoC 為主流。伴随着汽 車智能化、網聯化、電氣化的深入,低效的傳統分布式架構已無法滿足更新需求,汽車電 子電氣架構逐漸從分布走向集中,以減少車輛線束,提高内部資訊流轉效率。傳統分布式 架構下,汽車各功能子產品互相獨立,僅需 MCU 晶片即可滿足所需算力。而當電子電氣架 構向集中式演進,算力亦趨向于集中,僅依靠傳統 MCU 已難以滿足計算需求,也是以催 化了 SoC 晶片的發展。目前,自動駕駛晶片以 CPU、GPU 以及 NPU 等 AI 加速器組成的 SoC 晶片為主流,并作為算力平台內建在域控制器中,進而加速智能汽車走向跨域融合。各大主機廠基于下一代電子電氣架構的車型将于 2023 年起逐漸推出。特斯拉在 EE 架構變革中是引領者,在定義 Model Y 車型時直接跳過“域集中式 EE 架構”,直接進化 至“中央+區域 EEA”的“準中央計算式”。2022 款 Model Y 為中央計算子產品 CCM+左車 身控制子產品+右車身控制子產品設計,其中 CCM(Central Computing Module)子產品整合 ADAS(Advanced driver-assistance system)域和座艙娛樂域。目前國内各大傳統主機廠 與新勢力均加速布局,總體看在硬體上采用中央計算+區域控制架構方案,軟體上采用 SOA (Service-oriented architecture)軟體架構的設計理念。

我們總結各電子電氣架構的特點如下:分布式:各子產品功能劃分明确,軟硬體強耦合,各子產品可獨立開發,但無法共用 單個 SoC,且無法做到備援,分布式架構需要大量線束支援内部通信,加劇線束 成本。此外,各子子產品更新需要各供應商提供,疊代效率相對低下。跨域集中式:将分散的 ECU 集中至底盤、動力、座艙、智駕域中,進而減少内部 通信所需的線束成本,未來将逐漸簡化為智駕域、座艙域、車控域。此外軟硬體 可逐漸解耦,具備一定後期 OTA 靈活性。中央計算式:進一步簡化架構,顯著降低線束成本,引入 SOA 化設計開放軟體平 台,實作軟硬體解耦,各功能域共用一個中央計算平台。未來車載計算平台也有 望與雲計算相結合,實作車-雲一體化。同時,中央集中式架構也将真正實作“艙 駕一體”,這也對車載 SoC 晶片提出更高性能、安全等級與內建度的要求。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

格局:行業格局未定,英偉達引領中高端市場,地平線異軍突起

自動駕駛晶片曆經 10 年發展演變,國内格局發生較大變化。我們對其發展曆史及格 局變化進行複盤,從 2014 年至今可分為兩大階段:

2014-2018 年:玩家以 Mobileye、英偉達和傳統 MCU 廠商為主,自動駕駛功 能尚處早期,行業内入局者較少。該階段汽車仍以分布式 E/E 架構為主,自動駕 駛功能等級處于 L0-L2,用智能前視一體機即可實作智駕需求,對晶片算力需求 不高。Mobileye 長期深耕視覺 ADAS,自研“視覺算法+晶片”的軟硬一體方案, 憑借 EyeQ3/Q4 迎合市場需求,在該階段占據了 L1-L2 視覺 ADAS 晶片市場, 營收增速迅猛。同時,傳統 MCU 廠商例如瑞薩、TI 等廠商搭載于博世方案,也 占據大量市場佔有率。英偉達以通用 GPU架構為基礎,于2016年推出Tegra Parker SoC,搭載于特斯拉 HW 2.0 平台,正式将 GPU 路線的自動駕駛 SoC 推向市場, 但該階段的智駕 SoC 技術疊代仍較慢。

2019-2022 年:行業發展提速,英偉達引領高算力市場,地平線抓住時間視窗進 行國産替代。2019 年,特斯拉第一代自研 FSD 晶片成功,車企開始重視打造軟 硬結合的自動駕駛能力,自動駕駛晶片行業亦進入快速發展期。在低算力(30TOPS 以下)市場,地平線抓住時間視窗進行國産替代,逐漸搶奪 Mobileye 的市場佔有率。2019 年,地平線搶先釋出 J2 晶片(4 TOPS),并于 2020 年實作量産,搭載于長安主力車型 UNI-T。2021 年,汽車行業缺“芯”導緻車 輛減産,國内車企開始重視國産晶片供應商的培養。地平線于當年實作了 J3 芯 片(5 TOPS)的量産,自此在自動駕駛領域積累了先發優勢,并憑借更開放的 生态逐漸侵蝕 Mobileye 在國内的市場佔有率。據高工智能汽車(微信公衆号,除 非特别說明,下同)資料,2022 年 1-9 月,地平線在中國市場乘用車前裝标配 智能駕駛域控制器晶片的出貨量已躍居第二,僅次于特斯拉,Mobileye 則跌至第 三。除地平線和 Mobileye 外,TI、賽靈思、瑞薩等晶片廠商的 SoC 亦占有一席 之地。

在中高算力(30TOPS 及以上)市場,英偉達基于領先的 GPU 架構先聲奪人, 地平線則有望将國産替代的腳步帶向中高端市場。英偉達 2020 年針對 L2 市場 釋出 Xavier 晶片(30TOPS),搭載于小鵬 P7/P5 等車型;2022 年又推出大算力 Orin 晶片(256 TOPS),再次引領行業占據主流中高端車型市場,是此前所有瞄 準 L2+高階輔助駕駛車型的選擇。而地平線于 2022 年推出 J5 晶片(128 TOPS) 并上車理想,希望以更高的成本效益和更優的本土化服務與英偉達展開同台競技。此外,高通、黑芝麻、輝羲智能等一衆玩家也将于今明兩年正式加入中高算力芯 片的角逐賽。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

展望:小算力晶片需求保持強勁,大算力晶片走向更 新架構

中短期車企智能化政策因産品定價出現分化,算力需求有所不同

我們認為,中短期來看,随着今年車企價格戰的打響,前幾年一味堆料堆硬體的趨勢 将告一段落,務實和高成本效益将是決賽圈存活的關鍵。也是以,車企智能化政策或因産品 定價出現分化:

1) 10-20 萬元車型:追求高成本效益智駕方案,算力需求在 5-30TOPS。特斯拉降價 導緻國内車企成本壓力倍增,加速行業洗牌。我們認為,成本壓力下,10-20 萬 元的低端車型傾向于追求高成本效益智駕方案,中短期内仍将以傳統的 L2 功能為 主,部分車型或可提供基本的高速領航功能,算力需求在 5-30TOPS。傳統 L2 功能僅需 10TOPS 左右即可滿足需求。而高速領航作為 L2+的代表功能,算力配 置亦在下探。例如 2021 款理想 ONE 和上汽第三代榮威 RX5 智駕版僅分别搭載 了 2 顆和 3 顆地平線征程 3 晶片,即 10 和 15TOPS 的算力。是以,高速領航功 能已開始滲透至吉利博越 L、上汽榮威 RX5 等 20 萬元以下的車型。盡管在安全 備援性和體驗流暢度上或有所欠缺,但也可滿足功能的基本需求。但業内普遍認 為,高速領航若想要“好用”,即提供更高的備援性和更平滑流暢的駕駛體驗, 仍需更高算力的支援,30-60TOPS 的中算力晶片或更為合适。

2) 20-30 萬元車型:高速領航漸成标配,降本壓力下車企對硬體配置趨于理性,判 斷算力需求在 30-80TOPS。處于該價格帶的車型,一方面面臨特斯拉 Model 3/Y 的直接競争,成本壓力尤為明顯;另一方面也需一定的智能化程度以打造差異化 特征。我們認為,高速領航有望逐漸成為此價格帶車型标配,且相較于低端車型, 可以以相對更高的硬體配置提供更優的駕乘體驗,但車企在降本壓力下也将趨于 理性,不再一味堆砌硬體和算力,是以預計算力配置将普遍上升至 30-80TOPS, 中算力晶片有望成為主流選擇。

3) 30 萬元以上車型:追求更佳的智能化體驗,晶片走向大算力&新架構。我們認為, 30 萬元以上的高端車型受價格戰影響相對較小,主機廠追求打造标杆性的智能 化标簽,或将持續發力城區領航,目前算力配置普遍超 200TOPS。為了實作效 果更佳、體驗更優的領航功能,“BEV + Transformer”開始引領自動駕駛感覺範 式;長期看,“艙駕一體”也有望成為智能汽車 E/E 架構演變的終局。在上述兩 大技術趨勢的驅動下,自動駕駛晶片開始走向大算力&新架構。

小算力晶片:量産傳遞、安全穩定和成本效益是關鍵,地平線和 TI 領先地位 較為穩固

中短期來看,小算力晶片有望伴随 L1-L2 功能的快速增長進入規模放量階段。我們認 為,車企将更傾向于量産經驗豐富、傳遞能力強、安全穩定性高且成本效益突出的晶片廠商, 地平線和 TI 目前領先地位較為穩固,但仍有新玩家持續入場。過往輔助駕駛以基礎 L0-L2 功能為主,智能前視一體機即可實作,以 Mobileye、博世、 大陸、賽靈思的方案為主。而伴随輕量級行泊一體以及基礎高速領航功能滲透率的提升, 我們認為,內建 SoC 晶片的小算力域控平台将成為主流。由于小算力晶片的技術壁壘和架 構難度較中高算力更低,是以我們認為,晶片廠商的量産傳遞能力、安全穩定性和成本效益 将成為車企關注的重點。地平線憑借先發優勢、生态圈建立和本土化服務有望持續走在國内小算力晶片市場的前列;TI 主推的 TDA4VM 在功能完整度和車規可靠性上有較大優勢, 且實作了小算力晶片中少有的單 SoC 行泊一體方案,有望持續保持高競争力。Mobileye 由于黑盒方案難以滿足行泊一體等開發需求,未來或仍将主要針對 L1-L2 需求,将成熟的 感覺算法内嵌至晶片中打包出售,對自研能力較弱的車企更為友好。此外,以芯馳科技、 寒武紀以及愛芯元智為代表的廠商,此前在其它應用場景積累了較為豐富的量産傳遞經驗, 未來亦有機會切入智駕晶片市場,對地平線和 TI 形成競争壓力。

地平線:J2/J3 率先卡位小算力晶片市場,具有先發優勢,有望持續受益于國産 替代浪潮,走在國内小算力晶片市場的前列。

抓住國産替代時間視窗,具有先發優勢,本土化服務能力領先。地平線 J2/J3 芯 片分别具備 4/5 TOPS 算力,在推出時瞄準 Mobileye 所在的 ADAS 市場,且相 比于 Mobileye EyeQ4 具備更高算力與開放性,是以憑借晶片産品力、較完善的 工具鍊以及本土化服務能力,在供應鍊安全可控背景下,迅速受到衆多有軟體算 法自研需求的本土車企青睐。據高工智能汽車資料,2022 年 1-11 月,地平線芯 片在國内市場的出貨量已位列第二,超越 Mobileye,僅次于特斯拉。自研 NPU 架構,深度适配軟體算法,實作高效的 AI 計算。針對 10 萬-20 萬元 價格帶車型,主機廠追求高成本效益方案,晶片需要平衡好性能、功耗與成本三者 關系。地平線 J3 基于自研 BPU 2.0 架構,CPU+ASIC 路線相較于英偉達為代表 的 GPU 方案,能夠用僅 2.5W 的功耗,實作 5 TOPS 的算力,且公司主打軟硬 協同開發,晶片的實際算力的使用率相對較高。BPU(Brain Processing Unit) 是地平線自研的創新性嵌入式人工智能處理器架構,即 ASIC,也是地平線征程 系列 AI 的核心競争力,可将算法內建在智能計算平台上,提供裝置端上完整開 放的軟硬結合智能解決方案。

打造相對完善易用的工具鍊,并積極建構産業生态圈。地平線推出全鍊路 AI 開 發平台——Horizon OpenExplorer 天工開物與艾迪 AI 開發平台,兼顧高效與開 放兩大原則,便于車企基于地平線的硬體平台開發軟體與算法。其中,天工開物 AI 工具鍊基于地平線自研的 BPU 處理器架構,能夠整合各異的計算需求,提供 與晶片架構結合的編譯優化工具集,以保障計算資源的充分利用,提供對模型訓 練、優化編譯到應用部署的 AI 開發全流程支援,并支援 MXNet、TensorFlow、 Pytorch 等社群架構。同時,地平線還推出了 TogetherOS 車載作業系統,并開 放授權 BPU 技術架構 IP,允許車企開發部分晶片,打造開放的生态。

地平線市場佔有率測算:根據地平線披露的量産車型合作,我們測算地平線 2022 年在 10-20 萬/20-30 萬/30 萬元以上車型(具備 L2 及以上智駕功能)的總市占 率分别約為 10%/15%/1%。但需要指出的是,目前大部分 L2 車型仍以瑞薩、 Mobileye 以及博世等傳統低算力系統為主。如若隻考慮搭載 L2+ NOA 功能的車 型,根據高工智能汽車資料,地平線 2022 年的市占率達到 49.05%,位列行業 第一。展望未來,地平線于 2023 年上海車展密集宣布與比亞迪、大陸集團、采 埃孚等新的合作。我們認為,地平線在 10-20 萬元車型的領先地位較為穩固,未 來市占率将迅速提升,有望達到 30%-50%水準;而在中高端車型市場,地平線 也有望憑借大算力晶片先發優勢與本土化适配能力,與英偉達等頭部廠商競争, 穩固提升市占率。但也須注意的是,地平線 J2/J3 由于 CPU 算力較弱且缺乏 GPU,難以獨立實作 行泊一體方案,而對比 TI 的 TDA4VM 已成功實作單 SoC 的輕量級行泊一體方 案,未來或将是小算力晶片領域地平線的最大競品之一。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

TI:TDA4VM 在架構完整度和功能安全性方面占優,有望成為 10-20 萬車型輕 量級行泊一體方案的主流選擇之一。TDA4VM 算力高于 J3 和 EyeQ4,可實作單 SoC 輕量級行泊一體方案。TI 于 2020 年推出核心産品 TDA4VM,算力 8 TOPS,高于地平線 J3(5 TOPS)和 Mobileye EyeQ4(2.5 TOPS),且供貨穩定。目前,大疆、MAXIEYE、Nullmax、 禾多科技、縱目科技等玩家都在基于 TDA4 開發行泊一體方案。

架構完整且內建度高,利于車企和方案商進行二次開發。TDA4 采用多核異構架 構,內建了 ARM CPU、數字信号處理器(DSP)、深度學習加速器(DLA)、MCU 等單元,由對應的核或者加速器處理如邏輯算力和 AI 算力等不同任務。TI 的 AI 算力來自于自研矩陣乘法加速器 MMA(可類比地平線的 BPU),能夠提供較靈 活的矩陣乘法運算,通用性介于 GPU 和 ASIC 之間,是以擁有更強的可擴充性 與并行處理能力。值得一提的是,TDA4 是業内為數不多内置 ASIL-D 級 MCU 的 智駕 SoC。由于大多智駕 SoC 還無法滿足高功能安全等級的要求,是以常見做 法是在智駕域控主機闆上外挂一顆獨立的 MCU 晶片,比如英飛淩 TC297/397 等, 以提供狀态監控、整車底盤控制、執行最小安全風險政策等。為了簡化系統設計、 縮短通訊延時、節省硬體成本,部分晶片廠商開始在 SoC 内部内置 MCU 核心(功 能安全島 Safety Island)。TI 的 TDA4 系列就是内置 MCU 的典型代表,其 MCU 為 ASIL-D 級 Arm Cortex-R5F,進行了單獨電壓和時鐘設計,采用專用記憶體和接 口確定其與 SoC 其餘部分隔離,是以車企無須再外接 MCU 進行開發。盡管内置 MCU 已成趨勢,但與成熟穩定的傳統外挂 MCU 相比,内置安全島的功能安全性、 實時性和可靠性在實際應用中仍有一定差距。是以,域控廠商在使用地平線 J3、 黑芝麻 A1000 等晶片時,多數情況下仍會選擇外挂一個 MCU 提供安全備援,例 如宏景智駕為 2021 款理想 One 提供的域控制器就是“雙 J3+MCU”的方案。

但 TI 的相對劣勢在于,由于內建了 GPU、MMA、DSP 等衆多處理單元,TDA4VM 在高負載下功耗可高至 20W,對 Tier 1 與主機廠在散熱等方面的工程化能力提出 了較高的要求。此外,相比于純 ASIC 路線,TI 在特定算法上的運算效率或不及 地平線。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

Mobileye:傳統視覺 ADAS 龍頭,因黑盒模式和疊代較慢,市場佔有率正在被地 平線等其他玩家快速侵蝕。但其“視覺算法+晶片”的智能前視一體機方案具備 高成本效益,未來或将主要針對 L1-L2 需求,對自研能力較弱的車企更為友好。因黑盒模式和疊代較慢,市場佔有率正在被快速侵蝕。Mobileye 是昔日 ADAS 領 域的主要奠基者和引領者,提供算法+EyeQ 系列晶片組成的一體化軟硬體解決方 案。在 Mobileye 方案的幫助下,車企可高效且高成本效益地适配 L1-L2 級基礎輔 助駕駛功能。但随着汽車智能化程度的提升,車企開始希望對自身的智能化方案 有更高的話語權和主動權,而 Mobileye 的全棧黑盒模式已無法滿足大多數車企 的自研需求。此外,差別于主流 CPU 架構(ARM、X86),Mobileye 的 EyeQ4 晶片采用多 MIPS 處理器,導緻其通用性和可開發性較差,難以形成良好的軟體 生态。是以近年來,Mobileye 智能一體機方案吸引力開始下降。面對危機積極尋變,逐漸開放生态,但競争格局遠較此前激烈。2021 年,Mobileye 推出 EyeQ5 晶片,首次提供單晶片(silicon-only)版本,開放 SDK、OpenCL 環境和 TensorFlow,進而允許客戶部署自研算法,但目前 EyeQ5 晶片也僅收獲 極氪一家定點。自動駕駛晶片的競争環境日益激烈,海内外衆多車企正在将平台從 Mobileye EyeQ 系列遷移至英偉達、地平線、華為、高通等其它玩家。我們認 為,Mobileye“視覺算法+晶片”的智能前視一體機方案仍具備高性價優勢,對 自研能力較弱的車企更為友好。但随着汽車智能化能力逐漸提升,後續能否跟進 主機廠快速疊代的需求并進一步開放生态,将是 Mobileye 不掉隊的關鍵。

黑芝麻:基于 A1000L 打造行泊一體方案,獲一汽紅旗下一代 FEEA3.0 架構車 型定點,但相關車型規劃 2024 年 SOP,時間點上相較地平線和 TI 不占優。公 司早在 2020 年就推出了 A1000L 晶片,搭載 8 核 ARM Cortex A55 CPU、ARM GPU、3 核高性能 DSP、CV 加速引擎,以及自研 DynamAI NN 引擎,AI 算力 達 16 TOPS,具備業内領先的功能完整性與計算性能。基于 A1000L 晶片打造的 Drive Sensing 解決方案可實作單 SoC 晶片的行泊一體方案,支援 L2+高速領航 NOA、泊車 HPA/AVP、3D 360 環視全景、多路 DVR 等功能。2023 年 5 月,公 司宣布 A1000L 獲得一汽紅旗下一代 FEEA3.0 電子架構平台項目量産智駕晶片 定點。一汽紅旗将基于 A1000L 打造非分時複用的行泊一體自動駕駛域控平台, 該平台将應用于一汽紅旗 80%左右的車型,其中一汽紅旗 E001 和 E202 兩款車 型最快将于 2024 年量産落地。核心競争力來自兩大自研 IP:圖像信号處理 ISP 以及神經網絡加速器 NPU。ISP 負責“看得清”,可處理攝像頭采集的每一幀原始圖像資料;NPU 負責“看得懂”, 通過內建圖像分類、空間分割、特定目标分析等多個功能到單個神經網絡,可實 現結構化剪裁,進而幫助黑芝麻晶片提升神經網絡運算能力并降低功耗。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

愛芯元智:在智慧城市領域積累了豐富的傳遞經驗和完善的工具鍊,有望借此切 入小算力智駕晶片市場。愛芯元智成立于 2019 年,截至目前已成功推出了兩代 四顆端側、邊緣側 AI 視覺感覺晶片,并實作大規模量産供貨。目前愛芯元智的 主要下遊為智慧城市業務,例如智慧物聯領先方案商大華股份就是愛芯元智的重 要客戶之一,愛芯元智自主研發的晶片 AX630A 和 AX620A 已作為主要 SoC 應 用于大華股份多個産品線,并獲評大華股份 2021 年戰略供應商。基于自有 ISP 與 NPU的聯合架構設計,愛芯元智可大幅提升傳統 ISP中多個關鍵子產品的性能, 實作高能效比和高算力使用率。目前,公司也開始進軍智能駕駛領域,2022 年 8 月參與投資 ADAS 解決方案商 MAXIEYE,後續二者或有上車合作。我們認為, 愛芯元智在智慧城市領域積累的量産經驗和搭建的工具鍊可賦能智駕業務,尤其 是在小算力晶片市場,車企将更看重供應商的傳遞能力以及産品的易開發性。2019 至 2022 年,愛芯元智完成了近 20 億元的融資,投資方包括美團、美團龍 珠資本、騰訊投資、聯想之星等網際網路巨頭,以及啟明創投、GGV 紀源資本、 耀途資本等知名機構。

芯馳科技:座艙晶片對标高通,豐富的量産經驗與車企合作生态有望助力智駕芯 片适配上車,但内部資源在不同産品線間的合理化配置設定是關鍵。芯馳科技成立于 2018 年,作為國内少有的“全場景、平台化”的晶片和技術解決方案供應商, 産品包括域控晶片 E3、座艙晶片 X9、智駕晶片 V9 和網關晶片 G9。公司目前除 智駕晶片外,其餘三款晶片已實作大規模量産。尤其是在智能座艙晶片領域,公 司 X9 系列座艙晶片能夠在性能上對标高通,截至 2022 年年初已獲得超 50 個定 點,目前已上車上汽第三代榮威 RX5、奇瑞全新産品系列 OMODA 旗下首款車 型歐萌達和德國戴姆勒等。我們認為,芯馳在座艙晶片積累的量産傳遞經驗與産 業鍊生态建設有望助力其智駕晶片的滲透,但座艙晶片和智駕晶片在産品架構和 軟體算法上仍有較大不同,即使是高通目前在智駕領域的進展也并不如人意,且 作為初創公司,能否在不同産品間合理配置設定有限的資源目前來看仍待驗證。

寒武紀行歌:母公司寒武紀豐富的 AI 晶片技術積累有望遷移至車端,雲邊端一 體化統一生态架構,有助于建構車端推理-雲端訓練閉環。寒武紀行歌成立于 2021 年,作為寒武紀控股的子公司,行歌專注于自動駕駛晶片研發,目前在研數款智 駕晶片,覆寫 L2-L4:1)已接近量産的 SD5223 針對 L2+行泊一體方案,具備 高能效比,相較于 TDA4VM 算力提升一倍(16 TOPS)。2)基于 SD5223,寒 武紀推出低算力低功耗的 SD5223C,算力 6 TOPS,支援 8M 前視一體機和自動 泊車功能,或有望滲透傳統 Mobileye 占據的前視一體機市場。3)公司也表示未 來将推出面向 L4 市場的 SD5226,規劃算力超 400 TOPS,300K+ DMIPS,采 用 7nm 制程,并支援車端訓練,亦有望進軍中高算力晶片市場,但也須留意公 司晶片代工或受地緣政治因素影響,進而影響實際量産時間。寒武紀行歌自成立 以來,已與經緯恒潤、一汽等簽訂了自動駕駛合作協定,并累計獲得了上汽、蔚 來、甯德時代、博世創投等重磅産業資本加持,待産品技術打磨成熟,晶片有望 快速實作量産。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

中算力晶片:高速領航帶來發展機遇,各玩家皆有突圍可能

中算力晶片(30-100TOPS)市場此前相對空白,以英偉達 Xavier 為主。但随着車企 趨于理性,中端車型不再一味參與大算力晶片軍備競賽,但同時又希望實作較優的高速領 航功能,中算力晶片需求有所上升。目前來看,英偉達 Xavier 和 Orin NX/Nano、TI TDA4VH 以及黑芝麻 A1000 已瞄準該市場開始出擊,但同時也不排除地平線等其他廠商未來推出對 應産品以完善産品矩陣的可能性。是以整體而言,我們認為,中算力晶片市場的較量才剛 剛開始。與小算力和大算力相比,中算力市場或對晶片廠商的綜合能力有更高要求,場内 現有玩家皆有突圍可能。

英偉達:Xavier 和 Orin NX 有望占據中算力市場較大份額。2020 年,英偉達針 對 L2 市場釋出 Xavier 晶片(30 TOPS),搭載于小鵬 P7/P5 等車型;2022 年又 推出大算力 Orin 晶片(256 TOPS),再次引領行業占據主流中高端車型市場, 是此前所有瞄準 L2+高階輔助駕駛車型的選擇。但随着行業回歸理性,Orin 對于 大部分 20 萬-30 萬元的中端車型配置或過高,英偉達也是以通過硬體陸續推出 Orin NX(70/100 TOPS)和 Orin Nano(20/40 TOPS),完善自身産品矩陣。鑒 于 Orin X 目前已成功上車衆多車型,經過量産可靠性驗證,我們認為,較低配的 Orin NX 和 Nano 系列也有望共享同一套英偉達開發工具鍊與生态,以切入主流 車企的中端車型市場。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

黑芝麻:A1000 晶片算力 58TOPS,精準填補 50-100TOPS 晶片市場空缺,我 們預計 2023 年上車江淮思皓與領克 08。GPU 方面,A1000 自帶 GPU,能夠針 對泊車場景進行環視算法拼接,進而支援單晶片的行泊一體方案,對比地平線 J5 需外挂負責 3D 渲染的 GPU。CPU 方面,A1000 搭載八核 ARM Cortex A55, 具備多級緩存,能夠适應大量資料的預處理工作。CV 加速方面,A1000 包含 5 核 DSP 晶片,其中 4 核可以供客戶進行調用,是以釋放給客戶的 CPU 資源也更 為充裕,對比 J5 隻含雙核 DSP。由于很多算法設計需要大量用到 CPU 性能調 度,是以 A1000 或更利于客戶靈活開發部署算法。得益于較高的功能完整性, A1000 打造的行泊一體等方案成本效益較高。公司 2023 年 4 月宣布将推出 BOM 成本 3000 元以内的行泊一體域控方案,支援 10V配置和 50-100TOPS實體算力。

TI:TDA4 系列向中算力進軍以完善産品矩陣,已與主流 Tier 1 達成合作。此前 行業衆多 Tier 1 已基于 TDA4VM 順利開發面向 L2 場景的域控,TDA4VM 也已 成為單 SoC 輕量級行泊一體方案的主流選擇之一。TDA4VM 由于算力相對有限 (8 TOPS),是以實作的為“分時複用”的行泊一體方案,傳感器配置為 5V5R 或 6V5R,而基于單 TDA4VH(32 TOPS)或 TDA4VM Plus(24 TOPS)可實作非分時複用行泊一體方案,支援例如 10V5R 的更高階傳感器方案,以幫助 TI 進一步滲透 L2+市場。我們認為,得益于 TDA4VM 在小算力市場的成功,TI 不 僅積累了豐富的量産經驗,車企也可使用同一套工具鍊以實作更低的遷移和開發 成本,是以 TI 在中算力市場亦有一定優勢。目前德賽西威、福瑞泰克、百度等 廠商已宣布将基于 TI 中算力 SoC 開發域控,其中福瑞泰克 ADC30 域控基于 2 顆 TDA4VH 和 3 顆地平線 J5,公司預計 2023 年量産。

大算力晶片:BEV/Transformer+艙駕一體驅動晶片走向大算力&新架構

在“BEV + Transformer”以及“艙駕一體”兩大技術趨勢的驅動下,自動駕駛晶片 開始走向大算力&新架構。目前來看,英偉達和高通走在變革前列,地平線量産進度領跑 國内市場,華為 MDC 或涅槃歸來,架構變化下輝羲智能等國産廠商亦有突圍機會。趨勢 1:城區領航年内開始上車,“BEV + Transformer”引領自動駕駛感覺範式。在 此趨勢下,算法複雜度、資料規模以及模型參數均呈指數級提升,由此對車載自動駕駛芯 片的 AI 算力、資料吞吐量與架構創新也提出了更高的要求。

小鵬、華為領銜,城區領航年内開始落地。目前,城區領航尚處發展早期,小鵬和華 為的方案已于 2022 年 9 月開始落地,并在逐漸拓寬開放區域。小鵬城市 NGP(Navigation Guided Pilot)功能自 2022 年 9 月率先于廣州進行試點,2022 年 10 月于廣州全量推送;2023 年 3 月 17 日,小鵬宣布城市 NGP 功能向深圳地區開放,後又拓展至上海。北汽極 狐和長安阿維塔均選擇 HI(Huawei Inside)模式,依靠華為 ADS 高階自動駕駛全棧解決 方案打造城區 NCA 功能,分别命名為α-Pilot 高階智能駕駛輔助及 AVATRANS 智能領航 系統。極狐城區 NCA 已開通深圳、上海及廣州三地,覆寫車型為極狐阿爾法 S 全新 HI 版。阿維塔也于2023年3月 9日宣布在上海及深圳開啟城區NCA(Navigation Cruise Assis) 試駕體驗,覆寫車型為阿維塔 11,廣州、重慶兩地也即将開放體驗。除此之外,根據各公 司公告,理想、集度、長城等車企也計劃在 2023 年推出各自的城區領航功能。

城區領航被視為 L4 級自動駕駛功能在乘用車上的極緻演繹,實作難度和壁壘遠高于 高速領航,目前算力需求普遍超 200TOPS。盡管在系統訓練層面,自動駕駛 95%的底層 架構和基礎問題已經解決,但最後 5%的長尾問題,也就是 corner cases 的存在,是制約 無人駕駛實作的最大瓶頸之一。與場景較為規則、工況較為單一的高速領航相比,城區領 航路口多、變道多、擁堵多,corner cases 的數量和複雜程度大幅提升,不僅涉及異型車、 行人、路障等多類别主體,且存在加塞、“鬼探頭”、前車急停等非規律行車現象。據小鵬 在 2022 年 1024 科技日上的介紹,城市 NGP 的代碼量是高速 NGP 的 6 倍,感覺模型的 資料是高速 NGP 的 4 倍,預測/規劃/控制相關的代碼是高速 NGP 的 88 倍。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

城區領航對自動駕駛感覺算法提出了更高的要求,“BEV + Transformer”範式粉墨 登場。大模型是目前 AI 領域最為火熱的前沿趨勢之一,可賦能自動駕駛領域的感覺、标注、 仿真訓練等多個核心環節。在感覺層,以特斯拉為首,“BEV+Transformer”範式已開始 在自動駕駛領域得到廣泛使用,可有效提升感覺精确度,利于後續規劃控制算法的實施, 促進端到端自動駕駛架構的發展。

BEV 全稱 Bird’s Eye View,即鳥瞰圖,該算法旨在将多傳感器收集的圖像資訊投 射至統一 3D 空間,再輸入至單一大模型進行整體推理。相較于傳統的攝像頭圖 像,BEV 提供了一個更貼近實際實體世界的統一空間,為後續的多傳感器融合以 及規劃控制子產品開發提供了更大的便利和更多的可能。具體來說,BEV 感覺的優 勢在于:1)統一了多模态資料處理次元,将多個攝像頭或雷達資料轉換至 3D 視 角,再做目标檢測與分割等任務,進而降低感覺誤差,并為下遊預測和規劃控制 子產品提供更豐富的輸出;2)實作時序資訊融合,BEV 下的 3D 視角相較于 2D 信 息可有效減少尺度和遮擋問題,甚至可通過先驗知識“腦補”被遮擋的物體,有 效提高自動駕駛安全性;3)感覺和預測可在統一 3D 空間中實施,通過神經網絡 直接完成端到端優化,可有效降低傳統感覺任務中感覺與預測串行的誤差累積。

Transformer 的注意力(Attention)機制可幫助實作 2D 圖像資料至 3D BEV 空 間的轉化。Transformer 是 Google Brian 團隊在 2017 年提出的神經網絡模型, 起初用于機器翻譯,随着技術的發展開始進軍圖像視覺領域,目前已成功涉足分 類、檢測和分割三大圖像問題。據汽車之心微信公衆号介紹,傳統 CNN 模型的 原理是通過卷積層構造廣義過濾器,進而對圖像中的元素進行不斷地篩選壓縮, 是以其感受域一定程度上取決于過濾器的大小和卷積層的數量。随着訓練資料量 的增長,CNN 模型的收益會呈現過飽和趨勢。而 Transformer 的網絡結構在嫁接 2D 圖像和 3D 空間時借鑒了人腦的注意力(Attention)機制,在處理大量資訊時 能夠隻選擇關鍵資訊處理,以提升神經網絡的效率,是以 Transformer 的飽和區 間很大,更适宜于大規模資料訓練的需求。在自動駕駛領域,Transformer 相比 于傳統 CNN,具備更強的序列模組化能力和全局資訊感覺能力,目前已廣泛用于視 覺 2D 圖像資料至 3D 空間的轉化。

在“BEV + Transformer”趨勢下,算法複雜度、資料規模以及模型參數均呈指數級 提升,推動自動駕駛晶片向着大算力、新架構以及存算一體等方向演進。

1) 大算力:向數百 TOPS 算力演進。傳統 L1/L2 輔助駕駛所需處理的資料量小且算 法模型相對簡單,是以以 Mobileye 為代表的單目視覺+晶片算法強耦合的一體機 方案即可滿足需求。但領航功能作為高階輔助駕駛的代表,需要“更強算力+軟硬 件解耦的晶片+域控制器”來滿足海量資料處理與後續持續 OTA 疊代的需求。高 速領航開始向 20 萬元以下車型滲透,15-30TOPS 可滿足基本需求,但若想要“好 用”或需要 30-80TOPS。城區領航的場景複雜程度和技術實作難度更高,目前普 遍需要搭載雷射雷達,晶片以英偉達 Orin、華為 MDC 和地平線 J5 為主,算力配 置普遍超 200TOPS。而在應用“BEV + Transformer”技術後,多傳感器前融合 以及 2D 至 3D 空間的轉化需要 AI 晶片具備更強的推理能力,是以也需要比以往 更大的算力支撐,包括更高的 AI 算力、CPU 算力和 GPU 算力。

2) 新架構:加強并行計算能力和浮點運算能力。相較于 CNN/RNN,Transformer 具有更強的并行計算能力,可加入時間序列矢量,其資料流特征有顯著差别,浮 點矢量矩陣乘法累加運算更适合采用 BF16 精度。Transformer 允許資料以并行的 形式進行計算,且保留了資料的全局視角,而 CNN/RNN 的資料流隻能以串行方 式計算,不具備資料的全局記憶能力。傳統 AI 推理專用晶片大多針對 CNN/RNN, 并行計算表現不佳,且普遍針對 INT8 精度,幾乎不考慮浮點運算。是以想要更 好适配 Transformer 算法,就需要将 AI 推理晶片從硬體層面進行完整的架構革新, 加入專門針對 Transformer 的加速器,或使用更強的 CPU 算力來對資料整形,這 對晶片架構、ASIC 研發能力以及成本控制都提出了更高的要求。

3) 存算一體:SoC 晶片需配置高帶寬存儲器(HBM)或 SRAM,并加速向存算一 體靠攏,解決大算力下的資料吞吐量瓶頸。模型越大,記憶體對 AI 加速器就越重要, 以頻繁地讀取權重矩陣或訓練好的模型參數。據佐思汽研介紹,Transformer 中 的權重模型超過 1GB,對比傳統 CNN 的權重模型通常不超過 20MB。模型參數 越大,就需要更高的帶寬,一次性讀出更多參數。存算一體可分為近存計算(PNM)、 存内處理(PIM)以及存内計算(CIM),存内計算則接近存算一體。目前 PNM 已廣泛用于高性能晶片,即采用 HBM 堆疊,2.5D 封裝,進而與 CPU 內建,而 PIM 和 CIM 仍處在發展中。以特斯拉 FSD SoC 為例,其采用總帶寬為 68GB/s 的 8 顆 LPDDR4 記憶體,而內建在 NPU 中的 SRAM 可達到 32MB L3 緩存,帶寬 達 2TB/s,遠超市面上同類晶片。而據汽車之心微信公衆号,特斯拉在最新 HW 4.0 上的二代 FSD SoC 上使用了 16 顆 GDDR6,在記憶體用料上繼續引領行業。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

趨勢 2:長期來看,伴随跨域融合+中央計算式趨勢,支援“智能駕駛+智能座艙”的 艙駕一體多域計算控制架構或成為終局需求,我們預計 2025 年後開始初步量産上車。艙駕一體可有效降低開發成本和通訊延時、優化算力使用率和功能體驗,推動智能汽 車應用邁上新的台階。高工智能汽車統計,2022 年 1-10 月中國乘用車前裝同時标配“L2 級輔助駕駛+智能座艙+車聯網+OTA”的搭載率達 18.01%;且預測至 2025 年同時标配“智 能駕駛+智能座艙”的傳遞車輛有望突破 350 萬輛。我們總結艙駕一體的主要優勢在于:

降低成本:物料方面,相比于多 SoC 方案,單晶片內建度更高、使用物料更少, 且共用一套散熱系統帶來散熱成本下降。開發方面,目前智能化的實作仍需要車 企在不同的晶片組合之間進行挑選,由此帶來硬體及軟體開發的多平台成本消耗, 而使用單 SoC 可以節約此類額外的開發成本和多供應商的隐性采購管理成本,部 分底層軟體的共用也可降低不同平台車型的上車速度和軟體開發成本。

降低通訊延時,優化功能體驗:使用單顆 SoC 可使艙和駕之間資料傳輸從闆間通 訊變為片内通訊并共享記憶體,進而降低通訊延時,實作更流暢的艙駕功能。例如 英偉達 Thor SoC 支援所有顯示器、傳感器內建至單一 SoC,極大簡化了汽車制 造的複雜程式,并有助于傳感器資料更及時充分地複用,實作更流暢的汽車智能 化功能。

但“艙駕一體”距離真正實作仍有一定距離,軟硬體技術和工程化皆面臨挑戰。一方 面,座艙和智駕面向的應用場景、功能定義、性能邊界不一樣,如若融合在一起,晶片選 型、外圍電路設計、算力需求重點以及安全等級要求都不同,是以成本和性能的平衡難度 較大。另一方面,目前絕大部分廠商受限于軟硬體技術、對整體架構的了解和供應鍊等因 素,在技術上難以實作單 SoC 內建座艙和智駕功能。是以目前,更多廠商仍采用“多顆 SoC+多域控制器”方案。部分廠商已在單個域控制器中将座艙和智駕 SoC 部署在不同主 闆或同一個主機闆。例如特斯拉是“中央計算+區域控制”理念的最早實踐者,基于全系統 架構自研,能夠理清座艙、智駕和整車控制等系統之間的關聯,并在前期充分預留接口。早在 2019 年量産的 Model 3 車型中,中央計算單元 CCM 就融合了影音娛樂子產品(座艙)、 駕駛輔助系統子產品(智駕)以及車内外通信子產品,共用一套液冷系統。但這三個子產品仍分 别部署在不同的 PCB 闆上,各自獨立運作作業系統,是以并不算嚴格意義的艙駕一體核 中央集中式架構。想要實作真正的艙駕一體,即單 SoC 部署在單 PCB 闆,仍需要軟硬體 技術與工程化能力的不斷提升。

我們認為,待 EE 架構進化到中央內建計算架構階段,且業内逐漸完成底層軟硬體鋪 設,艙駕一體或有望在 2025 年後開始上車,同時推動自動駕駛 SoC 晶片走向以下趨勢:

1) 大算力:向上千 TOPS 演進,包括 CPU 算力、GPU 算力與 AI 算力。CPU 主要 負責邏輯運算和決策控制,需要同時負責智駕域和座艙域系統排程、資料處理與 指令運算,随着艙駕一體化下資料處理量增大,CPU 需要更大的算力支撐。GPU 擅長圖像渲染、圖形處理以及大規模并行 AI 計算,随着自動駕駛等級不斷提升、 座艙娛樂趨向大屏多屏化以及人機互動功能逐漸強化的背景下,GPU 算力需求也 将不斷提升。此外,目前自動駕駛 SoC 普遍會在 CPU 和 GPU 基礎上搭載 AI 加 速器,例如神經網絡處理器 NPU。根據公司公告,英偉達 Thor 和高通 Snapdragon Ride Flex SoX 均規劃 2025 年左右量産,面向艙駕一體化場景,算力達 2000TOPS。

2) 先進制程:可能采用 Chiplet 技術。要實作艙駕一體需要高算力支撐(通常超 1000 TOPS),并需要将功耗控制在合理範圍,自動駕駛晶片需要向更先進制程方向發 展,進而在相同面積晶圓下放置更多計算單元,提供額外的算力。目前車載 AI 晶片已下探到 5nm,但掌握先進工藝的企業較少,中國本土廠商還面臨台積電産 能限制問題。例如地平線 J5 就仍采用 16nm,一方面是使用了功耗/算力比更優的 ASIC,另一方面或也做了國産代工的兩手準備。在此背景下,Chiplet 技術有望 成為智駕晶片實作性能跨越的重要路徑,滿足算力、效率與功耗不斷提升的需求。Chiplet 又叫小晶片/芯粒,通過将多個小晶片與特殊封裝技術相結合,構成更大的 IC。相比于直接生産單 SoC,使用小晶片生産有助于提升晶圓面積使用率,且小 晶片可以重複利用,進而降低産品總設計和驗證成本。此外,采用 Chiplet 技術後, 各大廠商可以專注于自己的芯粒和 IP,省去多餘的 IP 費用。小芯粒的流片良率也 普遍更高。但需要注意的是,Chiplet 技術仍面臨産業鍊成熟問題和座艙和智駕融 合的工程化難題,目前仍處在發展過程中。而對于中國公司,Chiplet 技術中的小晶片仍大量采購自海外巨頭,是以國産替代的邏輯相對有限。

3) 新架構:分域隔離。座艙和智駕域功能內建在單 SoC 時,由于兩個域需求不同, 在做硬體資源配置設定時,既要定義應用的優先級,又要確定各自有足夠的資源,這 對底層的晶片架構提出了更高要求。同時,智駕與座艙域安全等級不同,所跑的 作業系統也不同,需要做好安全隔離,確定不同應用的功能安全和資訊安全,當 前座艙娛樂子產品需要達到 ASIL A,儀表子產品需要達到 ASIL B,而行車子產品需要達 到 ASIL D,這對晶片底層的加速器資源如何進行有效隔離也是比較大的挑戰,同 時艙駕融合需要在作業系統層面做虛拟化技術,也會帶來額外硬體開銷,但也确 保了各域之間功能與資訊安全性。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

英偉達:基于 GPU 高技術壁壘,長期引領智駕晶片技術革新。Orin X 是目前唯 一量産且算力超 200 TOPS 的大算力晶片,占據了主流中高端車型智駕晶片最大 市場佔有率。2022年9月,英偉達又釋出Thor SoC,算力達到2000TFLOPS@FP8, 面向中央計算式架構設計,支援雲端融合、一芯多用、跨域計算,被認為定義了 行業未來 3 年的發展方向,規劃 2025 年量産,已宣布極氪為首發車型。針對 BEV+Transformer:英偉達在 Hopper GPU 架構中加入 Transformer 推理 引擎,大幅提升 AI 運算效率。GPU 天生适合 Transformer 模型所需的浮點運算以及高帶寬需求,而英偉達又在 Thor 的 Hopper GPU 架構中加入了 Transformer 推理引擎,進一步提升其 AI 運算效率。該 Transformer 引擎于 2022 年已被英偉 達內建于 H100 訓練伺服器中,采用英偉達 Hopper Tensor Core 技術,能夠應用 FP8 和 FP16 混合精度,以大幅加速 Transformer 模型的 AI 計算,采用 FP8 的 Tensor Core 運算在吞吐量方面是 16 位運算的兩倍。此外,Thor 也旨在統一訓練 和推理端的精度,Transformer 引擎在用于推理時,無需進行任何資料格式轉換, 能夠以 FP8 輸出結果。此前英偉達、英特爾與 ARM 三家聯合推出 FP8 格式标準, 目前多數自動駕駛模型訓練由英偉達晶片完成,若能夠做到訓練與推理端統一使 用 FP8,則效率和準确度将大幅超越 INT8,是以 Thor 有望成為英偉達訓練晶片 客戶的首選推理端 SoC。值得一提的是,英偉達取消了 2021 年 GTC 大會上所發 布的 Atlan,我們認為主要原因之一就在于 Atlan 或沒有考慮 Transformer 專用引 擎且不支援 FP8 格式。

針對艙駕一體:英偉達 Thor SoC 提出“單晶片解決一切”,算力一騎絕塵,架構 持續引領行業。Thor 可以借助 NVLink-C2C 技術整合 Grace GPU、Hopper GPU 與次世代 GPU(ARM 最新伺服器 CPU 架構 V2 或波塞冬平台),實作 2000 TOPS 的 FP8 效能,并支援單 SoC 實作座艙與智駕等功能。DRIVE Thor 能夠進行多域 計算,可以将自動駕駛、車載資訊娛樂等功能劃分為不同任務區間,同時運作, 互不幹擾,并能夠将所有顯示器、傳感器計算需求集中至單 SoC。多計算域隔離 能力,可支援時間關鍵型的程序不間斷同時運作,在單 SoC 上可以同時運作 Linux、 QNX 和 Android,未來主機廠可以借助 Thor 隔離特定任務的能力,告别分布式 的電子控制單元,整合全車功能。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

高通:立足智能座艙,有望迅速跻身自動駕駛第一梯隊。針對智能座艙市場,高 通憑借骁龍 SA8155 迅速搶占中高端市場,SA8295 繼續代表座艙 SoC 最前沿技 術。而針對自動駕駛市場,高通憑借 Snapdragon Ride 自動駕駛平台以及去年發 布的 Snapdragon Ride Flex SoC 打響進軍高性能自動駕駛晶片的發令槍。針對 BEV+Transformer:基于消費電子與智能座艙領域積累的晶片開發經驗, 在 CPU 算力、浮點運算能力以及記憶體帶寬上持續突破,順應 Transformer 上車 趨勢。高通 2020 年初推出 Snapdragon Ride 自動駕駛平台,配備 SA8540P SoC 和 AI 加速器 SA9000P,提供若幹 SoC 和 ASIC 組合的方案,可覆寫 ADAS 到 L4 的算力需求(10-700+TOPS)。據佐思汽車研究微信公衆号上發表的文章《高 通自動駕駛平台 Snapdragon Ride 分析》(周彥武),Snapdragon Ride 中的 SA8540 或是骁龍 865 的車規版,而 S9000 或是雲端加速晶片 Cloud AI 100 的車 規版。骁龍 865 搭載 Adreno 650 GPU,全面提升 16 位/32 位浮點運算能力,并 特别加入 Hexagon 698 張量加速器,具備 Transformer 模型下車端的高效 AI 推 理能力。而 Cloud AI 100 則特别針對 AI 大模型推理打造,能夠提供 400 TOPS的算力,峰值性能是 Snapdragon 855 和 Snapdragon 820 的 3 到 50 倍,與傳 統的 FPGA 相比推理速度提高約 10 倍,且在 AI 推理的每瓦能效上超越英偉達 A100。

地平線:目前最有望挑戰英偉達上司地位的國産晶片廠商。地平線 J5 是目前唯 一規模化量産的國産大算力晶片,擁有 128TOPS 算力,30W 低功耗,領先同級 競品的 1531 FPS(真實計算性能)以及 60ms 超低延遲感覺能力。基于規模異構 近存計算、高靈活大并發資料橋及脈動張量計算核三大核心技術,J5 能以更少内 存、更高 MAC 使用率執行更多任務,将并行計算發揮到極緻,提升算力有效利 用率。這也利于晶片在不堆疊面積和有限功耗下,發揮最多的實際 AI 性能。J5 在 EfficientNet 模型測試中,FPS 名額優于英偉達 Orin 和 Xavier。目前 J5 已經 上車理想 L7、L8 Pro 等高端車型,未來有望進一步占據英偉達 Orin 市場佔有率。針對 BEV+Transformer:地平線開發适配 J5 的 Swin-Transformer 結構,可更 好發揮 J5 的算力優勢,顯著提升網絡性能、減少訪存時間。此外,在 3D 感覺算 法領域,地平線參考算法內建了基于 Transformer 的純視覺 BEV 模型、基于雷達點雲的 3D 檢測模型以及單目 3D 目标檢測算法。地平線所提供的 BEV 感覺模型 內建了目标檢測和語義分割多重任務,可開放支援包括 IPM(Inverse Perspective Mapping)、Transformer 等多種轉換方式,基于 Transformer 大模型,開放提供 包括 DETR 3D、GKT、PETR 在内的多類感覺示例。地平線還于 2023 年上海車 展釋出最新 3.0 BPU 架構納什,專為大參數量 Transformer、大規模互動式博弈 設計,可靈活支援 Transformer 的細小算子。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

黑芝麻:在功能完整性與成本效益上具備一定優勢,相比于部分 ASIC 路線公司産 品,或更能夠适應 BEV + Transformer 新趨勢。黑芝麻主要瞄準中高算力市場, 華山系列 A1000、A1000 Pro、A2000 的算力分别為 58、106 和 256TOPS。此 前,黑芝麻 A1000 的量産程序有所延遲,目前有望于今年上車江淮思皓與領克 08,正式開啟商業化之路。針對 BEV+Transformer:黑芝麻自研 NPU具有較好相容性,可兼顧 Transformer 算法。黑芝麻自研神經網絡加速器 NPU 以及圖像信号處理 ISP 兩大核心 IP,使 得 A1000 具備高性能&高能效,能夠做到卷積層平均 80%的 MAC 陣列使用率, 有助于客戶在大模型與複雜算法場景下更高效開發。

輝羲智能:瞄準 BEV + Transformer 行業新趨勢,切入大算力晶片市場,有望抓 住軟硬體尚未固化的視窗期,實作彎道超車。公司成立于 2022 年,創始團隊具 備微軟亞洲研究院、百度、商湯、上汽、蔚來以及上海交大等産學研背景,擁有 晶片&自動駕駛系統研發設計,以及量産适配上車的深厚經驗積累。公司于 2023 年 2 月完成由順為資本和小米聯合領投的數億元天使+輪融資。目前産品涵蓋車端 智能駕駛晶片和計算平台、雲端資料智能平台、城區 NOA 和 GPT 模型應用等全 棧式解決方案。晶片層面,公司首款産品 R1 SoC 即針對 BEV+Transformer 以及艙駕一體新趨 勢進行設計,規劃算力超 260TOPS,有望于 2024H1 SOP,具備支援 BEV + Transformer 的最新架構。公司主打“資料閉環定義晶片”,基于自研大算力架構, 介于 ASIC 和 GPU 之間,是以算法靈活性與通用性較高,能夠在 AI 算力、 CPU/GPU 性能、記憶體帶寬以及整體架構上支援大模型算法以及跨域計算等需求。工具鍊&生态層面,公司積極建構工具鍊生态,利于客戶加速向國産化平台遷移。輝羲提供完整工具鍊 RhinoRT,做到 CUDA Like,支援 BEV/Transformer 算法部 署,同時支援常見的 AI stack 以及客戶的自定義算子,有利于加速現有英偉達産 品客戶的遷移效率。

華為:定位 Tier 1,多元度賦能車企造車,自研 MDC 計算平台在架構與算力上 表現突出。我們認為,基于 MDC 計算平台、通信技術、大模型積累以及鴻蒙底 層生态,華為将持續引領自動駕駛基礎軟硬體行業,但目前仍主要面向智選車生 态合作夥伴,向更廣泛車企拓展的能力仍待觀察。MDC 平台為自動駕駛提供可擴充且靈活的算力支援。華為 MDC 平台基于多顆鲲 鵬 CPU 與昇騰 AI 晶片的 SoC 組合,推出 MDC210、MDC300F、MDC610 和 MDC810,實作 48 TOPS – 400+ TOPS 的算力,覆寫 L2+至 L4 級别自動駕駛。MDC 平台遵循平台化和标準化原則,能夠以一套軟體架構,支援不同硬體配置, 實作軟硬體解耦。同時,MDC 平台充分考慮到感覺、決策、規劃、控制等不同環 節對 CPU 和 AI 算力的不同需求,由自研鲲鵬 SoC 提供 CPU 算力,昇騰 SoC 提 供 AI 算力。2021 年 4 月,華為宣布 MDC 810 已實作量産,并于 2022 年正式上 車北汽極狐阿爾法 S Hi 版以及長安阿維塔 11,MDC 610 也于 2022 年量産上車。

自動駕駛晶片行業研究:中央計算,大模型與領航輔助引領新一輪創新

市場空間:中國自動駕駛晶片市場 2030 年有望超 700 億元

我們認為,中短期來看,随着價格戰打響,不同價位車型的智能化方案或有所分化, 進而産生對晶片算力和架構的不同需求。而長期來看,智能化滲透率決定需求,中央計算、 大模型等新範式決定技術路線,量産經驗、工具鍊、成本效益決定規模與競争格局。自動駕 駛晶片将是全産業鍊格局最為穩固、集中度最高的環節,我們判斷,全球市場 4-5 家、國 内市場 3-4 家寡頭或有望占據行業 80%-90%以上的市場佔有率。同時,我們對國内市場 2022-2030E 自動駕駛晶片市場規模進行測算,至 2025 年有 望超 100 億元,至 2030 年有望超 700 億元。我們測算的核心假設如下:

1) 乘用車銷量:我們假設 2023 至 2030 年,中國乘用車銷量以年平均 1%速度增長。2) 功能滲透率:針對傳統 L1/L2 功能,我們預計未來 2-3 年将是功能快速規模放量 的階段,分别将于 2024 和 2026 年達到滲透率的最高點(25%/40%),随後開始 逐漸下降,預計至 2030 年分别約 3%和 30%。針對 NOA 功能,我們預計高速 NOA 将于 2023 年開始加速落地,而城區 NOA 今年才正式開始上車,且需要 3年左右的時間實作“從有到優”,是以我們假設至 2025 年高速/城區 NOA 滲透率 将分别達到 15%/1%,至 2030 年滲透率将分别達到 45%/20%。而 L4 距離真正 落地仍有較遠距離,我們認為 Robotaxi 大規模鋪開的前提是前裝量産車型的推出, 而目前運作的車型仍為後裝改造車。根據我們進行的産業鍊調研,頭部 L4 玩家皆 規劃在 2025 年前後推出前裝量産車型,屆時才有可能沖擊萬台規模,是以我們 測算至 2025/2030 年,L4 滲透率将分别約 0.05%/2.0%,對應車隊規模超 1 萬和 50 萬台。

3) 晶片配置:我們假設,傳統 L1/L2 功能單車配備 1/1.5 顆小算力自動駕駛晶片, 高速 NOA功能(L2+)單車配備 1顆中算力自動駕駛晶片,城區 NOA功能(L2++/L3) 單車配備 2 顆大算力晶片,L4/L5 等全無人自動駕駛單車則需要平均配備 4 顆大 算力晶片。4) 晶片單價:L1/L2 等級自動駕駛系統通常配備以 Mobileye EyeQ3、地平線 J2/J3 為代表的中低算力晶片,以 J2 約 20-30 美元、J3 約 50 美元的價格測算,我們假 設 L1/L2 所配備的自動駕駛晶片單顆平均為 100/200 元。對于配置高速 NOA 功 能的車型,中算力晶片單價參考黑芝麻 A1000 約 100 美元、英偉達 Xaiver 約 150 美元,我們假設單顆平均價格為 1000 元。對于配置城區 NOA 以及 L4/L5 功能的 車型,我們參考英偉達 Orin X 約 400 美元的單價測算,假設單車配備的晶片平均 單顆為 2500 元。上述價格皆針對 2022 年進行假設,而伴随量産規模擴大,我們 認為晶片單價将呈逐漸遞減趨勢,且在中低算力晶片上表現更為顯著。

繼續閱讀