天天看點

ChatGPT為自動駕駛指了條明路

作者:科技新知
ChatGPT為自動駕駛指了條明路

ChatGPT繼續如同黑洞一般,吸引着各大勢力布局。

外界看來,這是人工智能領域中的裡程碑事件,代表着AI技術發展到臨界點,也同樣預示着原有的商業模式都有機會重塑一遍。

正如英偉達創始人黃仁勳所述,由于ChatGPT可以借助API方式被外界調用,意味着它可以接入各類軟體,它的出現也将像浏覽器改變網際網路、蘋果應用商店改變軟體行業一樣,對行業産生巨大的沖擊。

典型的如搜尋引擎、雲計算行業,由于ChatGPT的橫空出世,原有的市場競争态勢被打破。譬如百度可以借着文心一言,售賣其智能雲服務。這對于場上原有的玩家而言,機遇與挑戰同在。

那麼汽車行業呢?可以看到,近段時間内,車企們也頻頻在ChatGPT領域發聲:

先是,集度、長城、東風日産、愛馳、零跑、吉利汽車、海馬汽車等近10家車企加入文心一言的朋友圈;緊接着,毫末智行宣布,自動駕駛認知大模型正式更新為DriveGPT,在自動駕駛模型算法方面,全面應用ChatGPT的模型和技術邏輯。

ChatGPT之于汽車行業,乃至于更聚焦的自動駕駛領域,到底是放衛星還是起飛點?

止于語音互動“雞肋”?

集度是最早公開打出“ChatGPT上車”概念的車企。

2月14日,集度ROBOVERSE三裡屯體驗中心啟動會上,CEO夏一平率先宣布,将融合百度“文心一言”的能力,打造針對智能汽車場景的人工智能互動體驗,支援汽車實作自然交流的再進階。

據了解,此次“文心一言”上車集度,是全球類ChatGPT技術首次應用于智能汽車産品。

對于合作的具體細節,現場并未公布。對此夏一平表示,“關于具體會有哪些功能,我隻能說現在還在努力地去跟百度團隊在對接,因為大家也知道文心一言将在三月份釋出,之後才會去做我們的應用。”

不過,結合其他資料,可以大膽猜測出,ChatGPT大機率率先應用在語音互動方面。

畢竟,除了ChatGPT本身就是憑借其出色的互動能力出圈外,同一時期,長安汽車官方公号釋出了題為《假如把ChatGPT裝進長安深藍SL03》的文章,讓消費者自然而然聯想到車載智能語音互動功能上。

現階段,作為市場主流的互動方式,智能語音是智能座艙的标配功能。根據消費者調研資料,語音互動功能是座艙内體驗比例和滿意程度最高的互動方式。

ChatGPT為自動駕駛指了條明路

一般而言,主機廠将語音互動功能作為其産品智能化與差異化的核心展現。比如,梅賽德斯-奔馳的使用者體驗團隊為其車載語音體驗的開發設定了三個目标:

1. 允許司機像對待另一個人一樣自然地交談。

2. 支援比典型語音服務更多的查詢類型。

3. 将語音更自然地內建到整體車内體驗中,以便使用者可以在語音和觸摸控制之間無縫切換。

然而,現實往往很殘酷。由于車企對語音互動技術的掌握有所欠缺,導緻車載語音系統的互動程度普遍較弱,體驗一般,大多時候淪為“雞肋”。

個中緣由,其實在于智能語音互動技術上,仍然存在難點。

智能語音互動的技術邏輯主要包括三大部分:識别、了解和執行。目前提供解決方案的廠商中,識别部分已經趨于成熟,識别率可以達到90%。行業的痛點主要集中在“了解”部分,大部分的車載語音互動系統在“了解”上并不智能。

舉個例子,此前傳統主機廠提供的前端語音互動功能,大部分采用指令控制。使用者需按照指定指令進行互動,機器不具備語義了解能力。互動機械化,導緻整個系統功能單一、指令詞單一。

那麼,基于AI語言大模型,對任何領域的任何問題幾乎都能進行整合回答的ChatGPT,能否給車載語音互動系統帶來新的可能?

答案是肯定的。“ChatGPT在推理和學習能力上優勢明顯,不僅可以用于了解和對話,更可以通過上下文交流和自我學習,來實作輔助創作和知識進化。這些能力同樣适用車載語音互動領域,融合對話智能技術、深度學習大模型技術、工程化能力、大資料的潛力,帶來更流暢、更有效的響應……”思必馳汽車事業部産品總監葛付江如此認為。

從這點來看,如果汽車智能語音能夠植入類ChatGPT技術,在高使用者黏性之下,未來的商業化前景将更加廣闊。

當然,考慮到成本層面,又往往會将相關廠商拉回冰冷的現實。

根據Lambda官網資料,微軟為OpenAI設計了一個包含10000塊Nvidia V100 GPU的分布式叢集進行GPT-3的模型訓練,由于模型參數量較大(共1750億參數),訓練完成共耗費30天,消耗總算力為 3640PF-days。以Nvidia Tesla V100的 Lambda GPU執行個體定價為1.50 美元/小時測算,GPT-3的完整訓練成本将達到466萬美元/次。

自動駕駛的“突現”時刻

可以看出,ChatGPT短期内更多是在智能化方面,賦能汽車行業發展,離完全意義上的自動駕駛還是有些距離。對此,ChatGPT自身也給出了如下回答:

作為一個語言模型,ChatGPT主要用于生成自然語言文本,如對話或文章等。自動駕駛技術需要處理的是感覺、決策和控制等方面的問題,這些問題與ChatGPT所處理的文本生成任務并不相關。是以,在技術上,将自動駕駛技術與ChatGPT蹭熱點并不可行。但是,自動駕駛公司可以利用ChatGPT等自然語言處理技術來提高其産品的人機互動能力,以更好地滿足使用者需求。

實際上,這也是業内主流的觀點。此前,中國電動汽車百人會論壇(2023)專家媒體溝通會上,副理事長歐陽明高院士表示,ChatGPT出來之後會引發人工智能新一輪的革命,對智能駕駛也會産生深遠的影響。

“馬斯克做的就是基于這條技術路線,就是所謂的大模型、大資料、大算力……為了獲得大資料,必須要大量賣智能輔助駕駛電動汽車,尤其是城市輔助駕駛今年可能大家會争先恐後地上市,這也是很重要的技術趨勢。”

如何了解這段話?需要知曉的是,如果細究的話,ChatGPT成型背後有一個十分重要的基本原理能力—“突現能力(Emergent Ability)”,一般定義為“當系統中的量變導緻其行為發生質變時出現的現象”。

ChatGPT為自動駕駛指了條明路

簡單來說,在某個規模門檻值以下,大模型性能接近随機,而超過該門檻值,其性能遠高于随機。

各種測試表明,隻有模型達到GPT3的規模,即參數大于1000億,模型才有可能形成“突現能力”。而正是在“突現能力”的基礎上,AI模型展示了類似人類的複雜推理和知識推理能力,這就是所謂“思維鍊(Chain-of-Thought)”。

基于“思維鍊”的推理能力,不需要再進行複雜的訓練,而隻是在提問時附加給出提示,模型就能自動學習,并做出相應推理得到正确結果。徹底展現了AI模型對人類進階思維能力的模仿。

這個能力很可能是ChatGPT實作高度智能化的一個重要基礎。而這對于自動駕駛的路徑選擇來說,無疑會起到決定性的作用。

一直以來,圍繞自動駕駛技術的演進,業内也一直存在兩大“流派”:其中,Waymo、小馬智行等是“躍進式”的代表,政策是直接實作L4/L5級自動駕駛;特斯拉則是“漸進式”路線的代表,政策是先在量産車上優先搭載L2/L3級輔助駕駛,收集資料後再向L4/L5進發。

此前,雙方陣營泾渭分明,近兩年情況則有所改變。不少L4公司開始“降維”進入L2領域。例如,Robobus領域的輕舟智航,推出了高階自動駕駛解決方案;文遠知行則是獲得博世投資,将開展應用于乘用車的L2-L3級自動駕駛軟體的開發。

作為對比的是,“漸進式”玩家中,特斯拉已經生産了數百萬輛汽車,其搭載的輔助駕駛系統Autopilot,将收集到數十億英裡的路況和駕駛資料。上述這些行業動向,似乎都在宣告,漸進式路線階段性的勝利。

當然,業内也有不同的看法,認為當下隻是L2領域的勝利,能否漸進到L4尚且未知。而眼下,ChatGPT的橫空出世則讓行業認識到,不斷去累積公裡數,一直這麼跑下去是可以獲得更進階别的自動駕駛技術的跨越,量變能夠引起質變,自動駕駛也有機會迎來“突現”時刻。

這才是ChatGPT對于自動駕駛的重要意義,某種程度上,算是為自動駕駛指了條明路。

參考資料:

TechWeb《ChatGPT上“車”?沒那麼簡單》

蓋世汽車社群《ChatGPT,打了人車互動的“臉”?》

钛媒體《爆火的ChatGPT,能讓自動駕駛更快實作嗎?》