天天看點

200PB資料!揭秘Mobileye的自動駕駛“秘笈”

摘要:1月7日消息,Mobileye在CES 2022上宣布,目前已采集了200PB的資料,這意味着Mobileye擁有了一個虛拟的駕駛資料寶庫。這些資料配合Mobileye一流的計算機視覺技術和強大的自然語言了解(NLU)模型使用,即使是罕見條件和場景下的“長尾”事件,仍可以在幾秒鐘内輸出數千個結果。而這有助于自動駕駛汽車和一流的計算機視覺系統處理邊緣情況,進而讓自動駕駛汽車實作超高的平均故障間隔時間(MTBF)。

1月7日消息,Mobileye在CES 2022上宣布,目前已采集了200PB的資料,這意味着Mobileye擁有了一個虛拟的駕駛資料寶庫。這些資料配合Mobileye一流的計算機視覺技術和強大的自然語言了解(NLU)模型使用,即使是罕見條件和場景下的“長尾”事件,仍可以在幾秒鐘内輸出數千個結果。而這有助于自動駕駛汽車和一流的計算機視覺系統處理邊緣情況,進而讓自動駕駛汽車實作超高的平均故障間隔時間(MTBF)。

Mobileye總裁兼首席執行官Amnon Shashua教授表示:“資料和處理資料的基礎設施是為自動駕駛技術實作帶來了複雜性。Mobileye花了25年時間一直在收集并分析我們認為是業界領先的,包含了現實環境和模拟駕駛體驗的資料庫,通過實作強大的自動駕駛解決方案脫穎而出,這些解決方案能夠實作超高的平均故障間隔時間。”

Mobileye擁有全球公認龐大的汽車資料集,包含了過去25年中超過200 PB的真實環境駕駛視訊素材,共1600萬個1分鐘視訊片段。

200PB資料!揭秘Mobileye的自動駕駛“秘笈”

△Mobileye資料集擁有超過200PB的真實環境駕駛視訊素材

對自動駕駛所需的強大計算機視覺引擎而言,大規模資料标注是核心。Mobileye擁有豐富且相關的資料集,由2500多名專業标注人員手動标注或自動标注。該計算引擎依靠雲伺服器中的50萬個峰值CPU核心,每月處理5000萬個資料集——相當于每月處理由50萬小時的駕駛素材所生成的100 PB資料。

資料的價值在于能夠被解讀的同時并投入使用,這需要對自然語言的深入了解以及先進的計算機視覺算法,而這一直是Mobileye的優勢。

每個自動駕駛公司都面臨“長尾”問題,即自動駕駛汽車會遇到從未見過或經曆過的情況。這些長尾問題包含了龐大的資料集,但許多企業不具備高效了解這些資料集所需的工具。Mobileye先進的計算機視覺技術與強大的自然語言了解模型配合使用,能在幾秒鐘内查詢長尾資料集并傳回數千個結果。随後,Mobileye可以使用這些結果來訓練計算機視覺系統并使其更加強大。Mobileye的方法大大加快了開發周期。

Mobileye團隊使用内部搜尋引擎資料庫,其中包含數百萬張圖檔、視訊片段和場景。其内容覆寫面極廣,從“被雪覆寫的拖拉機”一直到“夕陽下的交通信号燈”,所有這些都由 Mobileye采集并饋入其算法(參見樣本圖像)。

200PB資料!揭秘Mobileye的自動駕駛“秘笈”

△Mobileye資料集包含數百萬張圖檔、視訊片段和場景

通過業内最高品質的資料和專業人才,Mobileye的駕駛政策可以確定做出合理、明智的決策,這種方法消除了人工智能決策的不确定性,并在統計上實作了超高的平均故障間隔時間。同時,資料集加快了開發過程,讓自動駕駛技術“挽救生命”的承諾可以更快地成為現實。

繼續閱讀