7月5日,理想召開2024智能駕駛夏季釋出會,正式宣布将于7月内向全量理想AD Max使用者推送“全國都能開”的無圖NOA,并将于7月内推送全自動AES(自動緊急轉向)和全方位低速AEB(自動緊急制動)。同時,理想汽車釋出了基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術架構,并開啟新架構的早鳥計劃。
從2021年啟動全棧自研,到今天釋出全新的自動駕駛技術架構,在全棧自研的背後,是理想對于智能化“向上”的錨定,這不僅僅是對技術高峰的攀登,更是對使用者體驗極緻化的承諾。
理想汽車智能駕駛研發副總裁郎鹹朋表示,我們結合端到端模型和VLM視覺語言模型,帶來了業界首個在車端部署雙系統的方案,也首次将VLM視覺語言模型成功部署在車端晶片上,這套業内領先的全新架構是自動駕駛領域裡程碑式的技術突破。
三大方向:智駕能力整體躍升
作為智能駕駛領域的先行者,理想汽車始終緻力于為使用者提供更加安全、便捷、智能的出行體驗。
釋出會上,理想汽車宣布将于7月内推送一系列智能駕駛技術更新,其中包括無圖NOA的四項重大能力提升、主動安全能力的進階以及自動駕駛技術的突破創新。這些更新不僅彰顯了理想汽車在智能駕駛技術方面的深厚積累,更為使用者帶來了前所未有的出行體驗。
其中,無圖NOA作為理想汽車智能駕駛技術的核心之一,此次帶來了四項重大能力提升。得益于感覺、了解和道路結構建構能力的全面提升,無圖NOA擺脫了對先驗資訊的依賴,使用者在全國範圍内有導航覆寫的城市範圍内均可使用NOA,甚至可以在更特殊的胡同窄路和鄉村小路開啟功能。這種全國道路高效通行的能力,無疑将為使用者帶來更加便捷、自由的出行體驗。同時,基于高效的時空聯合規劃能力,車輛對道路障礙物的避讓和繞行更加絲滑,進一步提升了使用者的行車安全感和舒适度。
在主動安全領域,理想汽車也取得了顯著的進展。通過建立完備的安全風險場景庫,并根據出現頻次和危險程度分類,理想汽車持續提升風險場景覆寫度。即将在7月内為使用者推送的全自動AES和全方位低速AEB功能,将進一步增強車輛在複雜場景下的主動安全能力。全自動AES功能的推出,将有效應對AEB也無法規避事故的實體極限場景,為使用者的行車安全提供更有力的保障。而全方位低速AEB則針對泊車和低速行車場景,提供了360度的主動安全防護,讓使用者的日常用車更加安心。
此外,理想汽車在自動駕駛技術方面也取得了突破性的創新。受諾貝爾獎得主丹尼爾·卡尼曼的快慢系統理論啟發,理想汽車形成了更智能、更拟人的自動駕駛技術架構。這一架構由快系統和慢系統兩個部分組成,分别負責處理簡單任務和複雜場景。快系統由端到端模型實作,具備高效、快速響應的能力;而慢系統則由VLM視覺語言模型實作,經過邏輯思考後輸出決策資訊給到快系統。這種雙系統構成的自動駕駛能力,不僅提高了車輛在大部分場景下的行駛效率,還確定了少數複雜場景下的高上限表現。
深耕大模型場景:開啟更多想象
随着新能源汽車的普及和智能網聯技術的快速發展,汽車産業正經曆着前所未有的變革。智能駕駛作為智能網聯汽車的核心功能之一,已成為車企競争的新焦點。汽車大模型憑借其強大的資料處理能力、深度學習能力以及多任務處理能力,為智能駕駛系統提供了堅實的基礎。
現場,理想展示了端到端模型、VLM視覺語言模型以及世界模型的融合創新的顯著進展,不僅提升了智能駕駛技術的效率和上限,還為自動駕駛系統的學習和測試創造了更優秀的虛拟環境。
具體來看,端到端模型作為理想汽車智能駕駛技術的核心之一,展現出了高效率的優勢。
該模型以攝像頭和雷射雷達的輸入為主,通過CNN主幹網絡對多傳感器特征進行提取和融合,并投影至BEV空間。為了進一步提升模型的表征能力,理想汽車還設計了兼具時間和空間次元記憶能力的記憶子產品。同時,車輛狀态資訊和導航資訊也被加入到模型的輸入中,經過Transformer模型的編碼,與BEV特征共同解碼出動态障礙物、道路結構和通用障礙物,并規劃出行車軌迹。
這種多任務輸出在一體化的模型中得以實作,中間沒有規則介入,使得端到端模型在資訊傳遞、推理計算、模型疊代上均具有顯著優勢。在實際駕駛中,端到端模型展現出了更強大的通用障礙實體解能力、超視距導航能力、道路結構了解能力以及更拟人的路徑規劃能力。
而VLM視覺語言模型則代表了理想汽車智能駕駛技術的高上限。
該模型的算法架構由一個統一的Transformer模型組成,能夠将Prompt文本進行編碼,并将前視相機的圖像和導航地圖資訊進行視覺資訊編碼。通過圖文對齊子產品進行模态對齊後,VLM模型能夠統一進行自回歸推理,輸出對環境的了解、駕駛決策和駕駛軌迹,傳遞給系統1輔助控制車輛。理想汽車的VLM視覺語言模型參數量達到22億,對實體世界的複雜交通環境具有強大的了解能力。即使面對首次經曆的未知場景,VLM模型也能自如應對。它能夠識别路面平整度、光線等環境資訊,提示系統1控制車速,確定駕駛安全舒适。同時,VLM模型還具備更強的導航地圖了解能力,可以配合車機系統修正導航,預防駕駛時走錯路線。在駕駛中,VLM模型還能夠了解公共汽車道、潮汐車道和分時段限行等複雜的交通規則,并作出合理決策。
除了端到端模型和VLM視覺語言模型外,理想汽車還緻力于世界模型的重建和生成技術的融合創新。通過将真實資料通過3DGS技術進行重建,并使用生成模型補充新視角,理想汽車建構了一個結合了重建和生成兩種技術路徑的世界模型。
在場景重建時,其中的動靜态要素将被分離,靜态環境得到重建,而動态物體則進行重建和新視角生成。再經過對場景的重新渲染,形成3D的實體世界。在這個3D實體世界中,動态資産可以被任意編輯和調整,實作場景的部分泛化。相比重建技術,生成模型具有更強的泛化能力。天氣、光照、車流等條件均可被自定義改變,生成符合真實規律的新場景。這些新場景用于評價自動駕駛系統在各種條件下的适應能力。重建和生成兩者結合所建構的場景為自動駕駛系統能力的學習和測試創造了更優秀的虛拟環境,使系統具備了高效閉環的疊代能力,進而確定系統的安全可靠。
後記:智能化牽引品牌“向上”
在科技飛速發展的今天,智能駕駛作為汽車行業的未來趨勢,正以前所未有的速度改變着我們的出行方式。而在這場變革的浪潮中,理想汽車以其堅定的全棧自研戰略,成為了引領行業智能化更新的重要力量。2024年智能駕駛夏季釋出會,不僅是對理想汽車過去技術積累的一次集中展示,更是對未來智能化發展方向的一次深刻探讨與布局。
目前,智能化正成為汽車品牌向上的不竭動力。而理想的全棧自研,意味着從底層技術到上層應用,從硬體到軟體,理想汽車都掌握在自己手中,這也能讓理想汽車能夠深入了解使用者需求,快速響應市場變化,不斷推出更加智能、安全、便捷的出行解決方案。
正如理想汽車産品部進階副總裁範皓宇表示,理想汽車始終堅持和使用者共同打磨産品體驗,從今年5月推送首批千名體驗使用者,到6月将體驗使用者規模擴充至萬人以上,我們已經在全國各地積累了超百萬公裡的無圖NOA行駛裡程。無圖NOA全量推送後,24萬名理想AD Max車主都将用上目前國内領先的智能駕駛産品,這是一項誠意滿滿的重磅更新。