自動駕駛之路的“能”與“不能”

一自動駕駛原理和技術大圖

任何一項技術領域可以從兩方面評價：技術難度和技術挑戰、市場規模和社會影響。若某一技術的技術難度和挑戰很高，但是市場規模和社會影響很小，那麼不值得進行投入。如果市場規模和社會影響大，但是技術難度和挑戰比較小，則無法充分發揮技術人員的能力。

而自動駕駛是市場規模和社會影響非常大，并且技術難度與挑戰很高的領域。從市場規模和社會影響角度而言，全球每天花在駕駛上的時間總計達數億小時，如果節約駕駛時間投入到其他工作，将會獲得更高的經濟效益。就技術難度而言，汽車駕駛行業本已是民用行業中較為複雜的領域，實作駕駛自動化、智能化的難度可想而知。

1 相關概念介紹

如下圖所示，智能駕駛、自動駕駛到無人駕駛是技術層層遞進、範圍層層縮小的關系。

無人駕駛

汽車在無駕駛員介入的情況下，能在限定環境乃至全部環境下完成全部駕駛任務。

自動駕駛

指汽車至少在某些或者全部具有關鍵安全件的控制功能方面（如轉向、油門、制動），無需駕駛員直接操作即可自動完成。包括無人駕駛以及輔助駕駛。

智能駕駛

包括自動駕駛以及其他輔助駕駛技術，例如語音預警提醒、人機智能互動等，能夠在某一環節輔助甚至替代駕駛員，優化駕車體驗。

自動駕駛分級标準

SAE（國際汽車工程學會）J3016 檔案提出的五級自動駕駛分級方案，是目前被自動駕駛領域與國際社會普遍認可采用的标準。該标準分為五級。

L1、L2 稱為輔助駕駛，其汽車駕駛的主體及負責方是駕駛員，自動駕駛系統輔助承擔部分駕駛任務。L1 在适用的實際範圍内，自動駕駛系統可持續執行橫向（如方向盤）或縱向（如油門、刹車）的車輛運動控制的某一子任務（不可同時執行）。L2 中自動駕駛系統可同時執行橫向或縱向的車輛運動控制任務。

L3 到 L5 自動駕駛系統可執行全部動态駕駛任務，車輛駕駛的主體及責任方為自動駕駛系統。L3 中駕駛員在有需要時作為備用參與駕駛任務。到 L5，自動駕駛系統承擔所有駕駛任務，駕駛員無需參與駕駛。

以上分級場景中 L3 仍有待商榷，是否存在解放雙眼卻需要駕駛員随時準備參與駕駛任務的場景。就使用者角度而言，L3 場景能否做到使用者友好。例如當使用者在 L3 級别場景下在車内玩手機，而系統突發事件要求使用者在 10 秒内接手駕駛操作。就技術角度而言，交通環境中時間即是生命，即使在很短時間内也存在事故發生的可能性。要求系統在 10 秒或更短時間内做出判斷與反應，或許已經超出 L3 級别的技術能力。

以上自動駕駛分級标準可以從另一個角度進行了解，如下圖所示。L1、L2 解放駕駛員雙手雙腳，無需操作方向盤、油門等，隻需要監視駕駛場景。L3 解放駕駛員雙眼，但是要在特殊需要時響應系統需求。在 L4、L5，駕駛員完全無需參與駕駛。

2 企業發展路線不同

根據不同企業的商業模式與其技術優勢的不同，不同企業發展自動駕駛技術的定位等級不同，采用的整體技術發展路線也不同。

目前以特斯拉為代表的車企多采用漸進發展路線，利用 L1、L2 自動駕駛技術輔助駕駛員優化駕駛體驗。以 Google 等為代表的網際網路或高科技企業更多面向 L4、5 方向進行自動駕駛技術的研發工作。

對于網際網路等科技企業而言，輔助駕駛技術對算法要求較低，更多以硬體為主，創造的價值不高。是以網際網路企業研究 L4 自動駕駛技術，尅占據更多創新技術優勢。車企注重硬體基礎，從 L1、L2 逐漸起步，逐漸提高自動駕駛能力等級，更符合企業發展需求。

另外，不同企業在傳感器方案技術路線、決策算法技術路線等的不同選擇，即為細分領域技術未定型而導緻的分歧，同樣基于整體發展政策的大背景。目前發展無人駕駛技術還存在很多挑戰。

3 自動駕駛技術原理以及技術大圖

不同級别自動駕駛技術的架構是相似的，因其對精度要求、功能覆寫度要求的不同而發展出不同功能。其技術架構核心分為環境感覺、決策規劃、控制執行三部分，與人類駕駛過程類似。

環境感覺

人類駕駛員通過耳朵和眼睛觀測環境、了解自己與周圍環境中交通參與者的位置與狀态。自動駕駛技術的環境感覺技術通過感覺算法與傳感器得到相似資訊，包括定位與感覺環境。

決策規劃

得到環境資訊後，通過決策算法和計算平台規劃駕駛路徑等資訊，同時保障安全性。

控制執行

通過控制算法與線控系統控制車輛按照規劃的路徑執行行駛操作。

如上圖所示，上述三部分核心技術涉及到諸多子產品。

算法

包括控制算法、定位算法、感覺算法與決策算法。就其成熟度而言，控制算法基本可以滿足技術要求。就阿裡巴巴目前實踐而言，定位算法在多數情況下能夠滿足精度要求。期待感覺算法做到精确識别周圍環境中物體的類别、位置、運動速度、方向等，目前還存在噪聲影響等問題。決策算法需要處理噪聲等問題，并且高效地規劃出可執行路徑。感覺算法與決策算法子產品作為自動駕駛技術的瓶頸，還有待優化。

傳感器

可以根據不同方案、層級選擇不同的傳感器方案。例如 L2 技術更多使用攝像頭與毫米波雷達，L4 技術需要使用雷射雷達。雷射雷達傳感器還存在許多問題，例如穩定性方面的問題。目前主要使用機械的雷射雷達，雖然固态雷射雷達進展快速，但是實踐證明固态雷射雷達還不能滿足自動駕駛技術的穩定性要求。

計算平台

既需要能力強，又要求低功耗。由于上層算法還未定義好，難以針對性制作或優化出适合算法的晶片。

測試手段

包括真實道路測試、仿真回歸測試。仿真回歸測試是自動駕駛領域的熱門問題，關于如何模拟駕駛環境及駕駛員的真實行為等方面，存在許多技術問題有待突破。

二自動駕駛的能與不能

如下圖所示，概括了目前自動駕駛技術的發展程度。

1 L1、L2

輔助駕駛系統已經落地産品化、規模化，例如特斯拉。未來幾年輔助駕駛系統将會安裝到越來越多的車輛上。

L3 存在一定争議，暫時不做讨論。

2 L4

将自動駕駛技術 L4 根據功能場景分為兩類。

中高速公開道路 L4

例如共享計程車、高速路上自動駕駛物流車。就算法角度而言，根據 Waymo 最新接管資料，自動駕駛車輛每行駛 1.3W 英裡需要人類駕駛員接管一次，該數字約每兩年可以翻一倍。而人類駕駛員每行駛約 5W 英裡需要接管一次。自動駕駛車輛單單從 MPI 角度達到人類司機的标準，還需要 4 年左右。另外，即使 MPI 達到标準，還需要考慮自動駕駛的駕駛行為、使用者友好體驗能否達到标準等标準。

硬體發展也需要一定時間。例如計算平台需要等到算法形成一定标準後才能進行針對性優化。

另外較為重要的一點是法律法規是否允許自動駕駛車輛上路。法律不容冒險，需要在技術成熟、能夠通過一定規模驗證的基礎上才能突破。

綜上幾點，中高速公開道路 L4 技術還需要較長時間才能突破。其産品化、規模化任重而道遠。

低速末端 L4

包括園區、社群、校園等場景下的自動駕駛實作。此類場景下車輛低速行駛就能滿足需求，突發危險時也可以及時停車。是以對算法精度的要求可以有數量級的降低。由于其算法并不複雜，硬體方面或許并不需要定制晶片，可以基于現有嵌入式計算平台進行開發與優化。同時由于其安全風險低，較容易得到法律法規支援。是以低速末端L 4有望在近期取得突破。

三阿裡巴巴自動駕駛的進展與思考

1 阿裡巴巴自動駕駛的使命

載物無人駕駛

在載人無人駕駛與載物無人駕駛中，阿裡巴巴自動駕駛定位為載物無人駕駛。賦能智慧物流，讓物流更便捷高效。

業務角度

阿裡巴巴需要選擇與經濟體業務相關聯的企業平台，例如天貓、淘寶、餓了麼、盒馬、菜鳥等，每天産生 1 億+包裹或外賣訂單，對人力要求非常高。自動駕駛可以極大程度承擔物流任務。

技術角度

載物無人駕駛比載人無人駕駛技術實作容易得多。首先，載物無人駕駛無需考慮舒适性等使用者體驗問題。第二，載物無人駕駛減少倫理道德問題，無需在發生事故時考慮應該優先保護車内使用者還是車外人類的安全。

是以阿裡巴巴定位為載物無人駕駛，既契合物流與倫理需求，技術實作也更為可行。

2 末端無人物流

由于算法、硬體、法律法規等方面的問題更容易突破，希望更夠更快實作商業落地。目前末端無人物流“菜鳥物流車”已經部署在多所高校實作常态化營運，實作末端配送，給使用者帶來了較大的便利。希望該産品能夠部署普及到更多高校、社群。相信末端無人物流将會為市場帶來巨大變化。

公開道路城配

探索性技術研發階段。

3 技術布局

包括控制算法、定位算法、感覺算法與決策算法。上文已有描述。

硬體

阿裡巴巴在傳感器與計算平台兩方面同步進行工作。傳感器方面有待進行定制化優化。即使是相對比較成熟的傳感器：攝像頭，有時也不能滿足需求，例如目前夜間行駛環境圖像不達标。計算平台方面，要實作無人駕駛系統的量産與落地，計算平台必須是嵌入式系統，才能保證低功耗和高穩定性。嵌入式系統的發展需要軟硬體同步進行優化加速，是以利用嵌入式系統及算法實作 L4 級别自動駕駛技術并不簡單，希望今年可以做到突破。

資料和基礎設施

在仿真系統、高精地圖等方面進行同步優化。

4 算法探索

如果算法部分的問題不能解決，後續進行計算平台等工作都比較困難。AI 算法在過去十年中取得了巨大進展，但是自動駕駛算法仍存在許多問題難以處理。

場景多樣性、複雜性

自動駕駛算法需要處理交通場景，規劃最優行駛路徑。然而實際交通場景複雜多樣，對自動駕駛算法提出了一大挑戰。

例如比較簡單的單一場景，其他車輛對自動駕駛車輛進行超車時的追尾風險評估。該場景看似簡單，但是由于車輛車型、速度、形式軌迹不同，導緻超車行為有完全不同的行為表現。如果想要使用一套算法處理好該場景下的不同行為，挑戰難度非常大。

處理多樣化場景 - No Free Lunch 理論

處理多樣化場景可以從兩個角度入手。第一，研發超級優秀的算法解決問題，但實際困難巨大，難以完成。第二，降低問題難度，用工程化思維解決問題。

如下圖所示，橫軸表示不同問題，縱軸表示算法解決問題效果。No Free Lunch 理論簡單了解是指難以使用一個通用算法解決不同問題。是以，需要針對不同場景下的問題開發針對性算法，并對其進行相應優化，進而最優化解決問題。

同樣地，自動駕駛場景複雜多樣，使用一種通用算法處理好所有場景挑戰難度非常大。是以需要将多樣的場景細化分類為多種子場景，針對每個子場景開發相應算法。通過該思路可以最大程度降低問題的難度，使其更易解決。

場景分類無統一标準

據上述，解決算法困難，場景分類是第一步，然而目前還無統一标準。自動駕駛場景難以建立統一分類标準，如下圖所示，業界已有一些分類标準，但是并不能滿足阿裡巴巴的要求。

根據行駛環境分類過于粗粒度，每一個子場景仍然非常複雜，算法開發無從入手。根據場景要素分類則更偏向于針對測試進行的分類，并非針對算法研發角度進行的分類，存在備援，部分子場景難以針對性開發解決算法。

阿裡巴巴自動駕駛場景庫

基于以上問題，阿裡巴巴提出了自動駕駛場景庫。如下圖所示，阿裡巴巴自動駕駛場景庫有以下特點。

高度精細化，例如上文提到的超車場景在場景庫中分為了 20+ 類。如下圖右側所示案例，一輛車由于發現路障緊急超車到右側車道，自動駕駛車輛緊急減速避讓。如果沒有進行場景分類，那麼隻能依賴于算法快速識别與反應做出判斷，對算法挑戰非常大，很多時候可能會反應失敗導緻需要人類駕駛員接管車輛駕駛。在場景分類後，可以預先判斷左側車輛在該場景下有超車的可能，提前刹車，避免需要人類駕駛員接管車輛的事件發生。此例也說明了場景分類對自動駕駛算法産生了正向影響。

動态場景互動是自動駕駛技術中最為困難的一部分。目前業界通用場景庫多依賴專家知識通過人工設計分類标準，以靜态場景為主（例如道路類型、車型、天氣）。人工設計場景分類标準更多地停留在語義層面，難以深刻了解自動駕駛場景中的動态行為。阿裡巴巴通過對大量路測資料進行分析、聚類，擷取具有挑戰性的場景資料。以資料驅動的方法進行場景分類，形成了以動态行為為主的自動駕駛場景庫。

5 AutoDrive 平台 – 高效處理精細化場景

建好場景庫後，需要對每個場景開發針對性算法。假設有 1K 個子場景，在極端情況下，需要針對性開發 1K 個算法，算法工程師需求很大。目前的通用開發模式是人工+智能。例如開發決策算法，需要極大程度依賴于算法工程師的知識經驗，設計相應超參數、網絡結構、規則等，效率非常低。

人工智能的發展是逐漸用計算方式替代人工設計的過程。例如在深度學習出現之前，是由人工設計特征（例如表達圖像形狀的特征），該方式效率低下。是以利用深度學習，通過自動化學習、計算提取特征代替人工設計特征。而在自動駕駛領域，計算方式替代人工設計的應用并不廣泛。例如在決策規劃方面，人工設計比重依然很大。一方面導緻人工需求量大、開發效率低，另一方面人工設計無法達到最優設計。

考慮以上因素，阿裡巴巴開發了 AutoDrive 平台。該平台利用計算換智能，替代人工，進而提升算法設計的效率及品質。希望通過學習、搜尋的方式自動化完成多數工作（例如設計超參數、網絡結構、決策規則等）。目前 AutoDrive 平台已經取得一定進展，針對自動駕駛鍊路中的每個子產品都可以進行自動化學習。

視覺應用案例 – NAS for 2D 識别與檢測

利用 AutoDrive 平台針對感覺算法進行自動化學習。由下圖結構對比可見，人工設計反而使系統結構更加複雜。人難以了解高維空間發生的事件，是以會堆砌許多業界使用的結構，通過結構深度的增加換取計算精度的提高。是以，人工設計結構中不可避免地存在很多備援。而 AutoDrive 平台可以搜尋到如下圖右側所示的簡單結構，該精簡結構就能夠達到甚至超越人工設計的複雜結構的精度。

此類精簡結構在自動駕駛領域十分重要。自動駕駛計算平台必須是嵌入式系統，要求低功耗。通過AutoDrive平台自動化學習、搜尋的方法能夠大幅度降低計算複雜度，進而降低計算平台資源消耗，使計算平台更易于設計。

效果

如下圖所示，除上述感覺案例，AutoDrive 平台精細化場景庫也應用到了決策規劃、定位等多個算法子產品中以期實作自動化設計。

例如路口防碰撞政策，應用 AutoDrive 平台對其參數進行自動化學習與優化後，相比人工設計規則和參數的效果提升 16.5%。

為使自動駕駛問題變得更加簡單，對其進行場景分類。将 Cut-in 場景分為 25 類進行針對性解決後，相比于使用一套通用算法解決困難效果顯著提升 18.7%。同時說明了精細化場景庫的優勢。

AutoDrive 背後的自動駕駛雲平台

AutoDrive 未在自動駕駛領域廣泛應用，因為其對背後的工程平台要求很高。就相似平台 AutoML 而言，AutoDrive 與 AutoML 平台仍然存在很大不同。AutoML 主要處理二維（例如圖像、文字）資訊或資料，是以其資料輸入輸出相對簡單，并且隻需要驗證其分類結果是否正确。而 AutoDrive 需要處理複雜的、多模态的、時序的自動駕駛信号（例如視訊），并且就此類信号模拟最終産出結果。例如驗證決策規劃，需要仿真模拟某一參數改變後的車輛行駛軌迹。是以 AutoDrive 不僅難度更高，也增加了工程困難。

是以在 AutoDrive 背後需要依靠包括仿真、資料标注、資料管理、模型訓練、計算資源、計算平台等的大規模工程系統，才能支撐 AutoDrive 的發展。

6 基于“No Free Lunch”理論的自動駕駛算法研發的化學反應

阿裡巴巴針對自動駕駛技術的算法瓶頸問題，提出結合以下 3 個方法，大幅度推進算法研發的進度。

場景精細化

分解複雜場景問題，簡單化解決。

算法針對性

對分類後子場景進行針對性算法開發、針對性優化，進而提升每個場景的成功率。

雲平台高效化

提出 AutoDrive 平台，通過計算換智能減少人工設計、人工參與，減少對自動駕駛領域專家知識的依賴，進而提升研發效率與品質。

四總結與展望

1）以 AutoDrive 為代表的自動化學習平台将會在自動駕駛研發中發揮越來越重要的作用。

2）随着算法的優化提升，軟硬體協同設計将會越來越受重視。

3）就落地角度，除了 L2 輔助駕駛會繼續普及，低速非公開道路無人車有望在近期逐漸實作産品化、規模化。

自動駕駛之路的“能”與“不能”

一自動駕駛原理和技術大圖

1 相關概念介紹

2 企業發展路線不同

3 自動駕駛技術原理以及技術大圖

二自動駕駛的能與不能

1 L1、L2

2 L4

三阿裡巴巴自動駕駛的進展與思考

1 阿裡巴巴自動駕駛的使命

2 末端無人物流

3 技術布局

4 算法探索

5 AutoDrive 平台 – 高效處理精細化場景

6 基于“No Free Lunch”理論的自動駕駛算法研發的化學反應

四總結與展望

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希

自動駕駛之路的“能”與“不能”

一 自動駕駛原理和技術大圖

1 相關概念介紹

2 企業發展路線不同

3 自動駕駛技術原理以及技術大圖

二 自動駕駛的能與不能

1 L1、L2

2 L4

三 阿裡巴巴自動駕駛的進展與思考

1 阿裡巴巴自動駕駛的使命

2 末端無人物流

3 技術布局

4 算法探索

5 AutoDrive 平台 – 高效處理精細化場景

6 基于“No Free Lunch”理論的自動駕駛算法研發的化學反應

四 總結與展望

繼續閱讀

一自動駕駛原理和技術大圖

二自動駕駛的能與不能

三阿裡巴巴自動駕駛的進展與思考

四總結與展望