天天看點

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

作者:DT時代

如今,新能源汽車已經成為許多國人買車的首選項,尤其是智能化的操控體驗是傳統燃油車難以比拟的。但無論是自動駕駛還是智能控制,這些技術背後都離不開強大算力的支援,尤其是車輛傳感器産生的大量資料會更需要實時處理和分析。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

2024年1月,數字中國萬裡行暨算力經濟中國行專家團來到坐落于浙江省湖州市長興縣的吉利星睿智算中心,除了參觀考察算力基礎設施,也深入了解算力是如何賦能車企的各種業務,如人工智能、大模型、智能駕駛、智能座艙等等熱點話題。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

第十四屆全國政協委員、中國科學院計算技術研究所研究員 張雲泉

正如第十四屆全國政協委員、九三學社中央科技專委副主任、九三學社中央科普工委副主任、全國信标委算力标準工作組組長、中國科學院計算技術研究所研究員張雲泉博士所說:“在數字經濟時代,算力成為新的生産力,而算力經濟則是數字經濟衍生的一種新經濟形态,尤其在汽車産業,資料和算力擴充到全環節”。汽車智能化作為汽車産業更新發展的重要方向,新能源汽車正是算力應用的最直接表現——每一輛汽車出廠之前,工程師們就已經為整車進行完善的智能操控與應用測試,確定使用者更安全的智能駕駛、更智能的智能座艙。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

吉利汽車中央研究院資料智能開發中心主任 陳勇博士

為了深度挖掘資料應用價值,吉利通過“1個中心+3個平台+N個全場景資料智能化服務”建構全場景數字化智能服務。吉利汽車中央研究院資料智能開發中心主任陳勇博士介紹,1個中心即智算中心。3個平台分别為大資料應用平台、人工智能應用平台、智駕資料閉環及虛拟現實仿真平台,提供的資料智能化服務包括AIGC人工智能内容生成、虛拟現實仿真平台、仿真計算應用平台、遠端診斷RVDC、售後智能服務等等。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

資料驅動

智算賦能

吉利星睿智算中心于2022年7月完成一期建設,2023年2月27日正式揭牌。該資料中心總投資10億元,占地52.12畝,規劃機櫃5000架,一期已建成标準5kW機櫃2520架目前(2024年1月),資料中心正在運作的CPU資源約6萬多個、GPU卡2千多張、存儲容量超過60PB。

傳統資料中心的建設思路是先把基礎設施建立起來,再逐漸把業務遷入。而吉利面對智能化浪潮,需要的是自上而下的規劃,迫切需要将數字化、智能化業務支撐起來,通過業務驅動平台的建設。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

吉利汽車中央研究院智算平台開發部部長 謝東

在2022年7月,吉利星睿智算中心初步建成之時,短時間内便湧入了大量業務。吉利汽車中央研究院智算平台開發部部長謝東表示,作為全球車企中首個“雲、數、智”一體化超級雲計算平台,吉利統一智能化架構,統一研發、統一營運,全棧租戶化來營運。

吉利整體的研發體系基本上是圍繞資料來開展的,包括資料的采集、資料的處理、資料的應用,以及資料的合規化處理等。

星睿智算中心的算力設施主要分為三大區域:智駕區、通用區、仿真區。智駕區運作的業務包括資料采集管理、資料标注管理、智駕仿真管理、資料管理平台、模型研發平台等。通用區主要服務智能座艙、雲車機研發等,以及研發系統統一的資料湖等。仿真區的主要業務包含碰撞、強度、電磁、氣動、熱管理等汽車運作的各方各面,需要吞噬大量高精度算力。

運作一年多來,從産品(新能源車)角度看,智算中心也獲得不少階段性成果,如:

NOA量産全面接入,給主流價格區間車型帶來了更多智駕能力(如博越L),實作智能駕駛資料自動閉環;

推出了新一代座艙作業系統銀河NOS,覆寫多款車型需求,讓使用者的車機互動體驗與手機無異;

全場景AI服務,包括全場景AI模型、WOW桌面、AI音樂律動、兒童繪本等,實際落地應用了大模型、AIGC等技術;

業内領先的大資料應用服務,如資料湖及治理能力,支援超過350萬輛車的資料實時回傳資料平台,治理水準達到0988,通過大資料應用提升産品使用者服務、對使用者實時進行關懷等;

可以為新能源車提供7×24小時的雲端守護,如銀河E8的神盾電池安全系統包括了雲端的安全智能管控,可以做到事前預警、事中報警。

目前,作為國内車企中自建裝置規模最大、綜合算力領先、業務覆寫領域最廣、高安全級别的智算中心。吉利也正聯合甯暢等伺服器廠商智能化支撐能力最強的智算中心,同時基于第四代英特爾® 至強® 可擴充處理器并應用落地的超大規模科學計算叢集,實測雙精度浮點算力達3.54 PFlops,基于全智能化業務的造車“超級大腦”,顯著提升了吉利的整體研發效率。

資料閉環

決戰智能駕駛下半場

目前進入市場的自動駕駛都經曆了傳感器、算法、算力的進化,需要做大量的資料标注、行為預警、道路點位等工作。但這些隻是智能化的冰山一角,或者說,是自動駕駛的“上半場”。随着L2級輔助駕駛功能在新車滲透率超過30%,人們對智能駕駛提出了更高的要求,會逐漸開始關注冰山下的部分。但是,随着量産的智能化車輛保有量增加,資料量劇增,如何合規地擷取資料,如何有效利用資料,并将資料轉化為産品競争力,還面臨諸多挑戰。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

吉利汽車中央研究院智能駕駛中心資料平台部部長 陶世俊

在吉利汽車中央研究院智能駕駛中心資料平台部部長陶世俊看來,吉利是主機廠唯一具有合規采集資質的,利用車輛保有量優勢,積累了大量資料。一輛車每個月的合規資料采集量是幾個GB的量級,星睿智算中心每天的采集資料增長量達到了TB 水準。如此龐大的資料,如果不加以治理,其有效的資料量會比較低,沒有辦法直接使用。而且,如果沒有一個很好的底座平台,整個資料的流轉也會有很大的問題。在星睿智算中心積累海量資料的基礎之上,還要不斷在各個場景下進行優化,并建設資料閉環能力:感覺資料閉環、地圖資料閉環、駕駛資料閉環和使用者資料閉環。

吉利基于使用者車隊及集團内營運車資源,積累了大量資料,以達到資料驅動感覺提升的目标。尤其是有更多機會發現Corner Case(邊角場景或極端場景)等,為規控、算法做一些優化的疊代。

依托吉利星睿智算中心和資料閉環技術能力,目标是要以車載端0.1倍的算力,用一套标準的資料格式,利用雲端10倍的算力,達到100倍的采集效率。

資料合成:

大模型時代的助推器

資料閉環涉及到海量的資料,其中面臨兩個問題:其一,在自動駕駛領域需要長周期的資料采集,需要重點發掘Corner Case和Long tail場景,分布廣、機率低,采內建本高。其二,所有算法或系統要上路之前,必須進行嚴苛的道路測試,需要覆寫很多的場景和安全隐患。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

益企研究院創始人 張廣彬

在益企研究院看來,前一種問題是屬于“未知的危險”,後一種問題是“已知的危險”。前一種問題随着資料積累,會逐漸被發現并轉化為應覆寫的場景,但發現新的極端場景的難度也會越來越高。後一種問題則面臨難以覆寫或複現的困境,譬如凍雨等特殊的氣候情況,再如不合法的交通參與者。是以,近年來業界開始在視覺問題中引入合成資料(Synthetic Data),用于解決資料難以擷取和标注的問題。

合成資料首先可以解決多樣性的問題。Corner Case很難在真實道路上擷取,甚至無法通過已知規則進行3D重建。但合成資料具有程式設計性,可以通過排列組合大量參數、引入随機化等方式,産生大量的場景。增加資料集中合成資料的數量,可以讓訓練出來的模型具有更好的泛化能力。

合成資料有很高的效率。真實資料的标注需要很高的成本,一張圖需要1~5元,準确率也受限于人類的認知、情緒、疲勞等一緻性問題。一般預标注模型精度不足,也需要大量的人工修正。而大模型自動化标注準确性高于人類,可以達到99.2%,且效率更高。合成資料有着合規安全的天然優勢。真實采集的資料需要進行脫敏,如車牌号等等,也不便于在不同企業間共享。

數字中國萬裡行|智算助力資料閉環,開啟吉利智算時代!

吉利汽車中央研究院前瞻創新部人工智能模型開發總工程師 梁振寶

吉利汽車中央研究院前瞻創新部人工智能模型開發總工程師梁振寶介紹了吉利在合成資料方面的整體布局:依托智算中心的強大算力、生産中心業内最大的資産資料湖,以及自動駕駛大模型,建構一個虛拟的元宇宙世界,進行合成資料的采集,也包括了基于真實資料的一些自動化标注、同類聚合,還有一些辨別化的資料治理。在此基礎上可以提供一些應用上的服務能力,包括資料合成、場景合成、算法測試、法規認證以及标注和資料治理,還包括數字孿生的智慧城市。整個系統架構其實是圍繞仿真核心,打通傳統設計和實體傳感器模型,包括自動化的評測體系和軟硬體測試鍊路。

吉利的合成資料和仿真測試平台具有幾大關鍵能力:

首先,依托于星睿智算中心的強大算力。

其次,擁有一套高逼真度的車輛模型,不論自車還是他車,它的特征與實車一緻,包括其中的傳感器模組化。交通理論部分也不僅是簡單的直行或左右變道,而是用AI的方式去驅動行為,包括壓線、惡意變道等行為。這樣才能確定合成資料或測試時有很好的逼真度。

其三,足夠真實。通過人工智能大模型可以把合成的資料往真實的資料風格進行遷移,遷移後的風格和逼真度就會有所改善。

其四,基于AI自動模組化,比人工模組化效率高。根據真實的場景資料和法規限制,可以一小時内生成上千公裡的行為場景,并進行光線、天氣、光照的模拟。譬如做海外項目,可以根據當地規則進行搭建,而不需要再去國外進行采集。

最後,改善資料治理。利用這個平台,吉利回調了大量的資料,以往這些資料可能隻是躺在資料湖裡。經過分門别類的治理,有利于快速找到這些資料,也有利于分析資料的分布。研究中心做了一套基于圖像分類的算子,有九大類政策、約120多個小類,包括各種天氣、工況、障礙物,還有辨別的一些識别算法,可以快速的把圖檔中所含的資訊打上标簽,之後就可以基于這個标簽對所有的量産回傳的資料進行統計和治理。

不止于智駕

電動化與智能化是相輔相成的,智能化給了汽車新的屬性。傳統的汽車是代步出行的工具,在智能網聯時代、智慧城市當中,汽車是一個移動的智能網聯節點,接收、産生、傳遞大量的資料。吉利“1個中心+3個平台+N個全場景資料智能化服務” 更是展示了吉利在智能汽車新時代的行業領先的智算代際優勢,迎來屬于吉利的“智算時代”。

繼續閱讀