天天看點

加拿大工程院院士于非:從“自動駕駛”到智能互聯

加拿大工程院院士于非:從“自動駕駛”到智能互聯

智能聯網不僅是技術問題,也是經濟問題。

作者 | 莓酊

編輯 | 青暮

由雷峰網主辦的第六屆全球人工智能與機器人大會(GAIR 2021)近日在深圳召開。

會上,IEEE/ IET/ EIC Fellow于非教授向與大家分享了題為《互聯:從品質、能源、資訊到智能》的演講。

于非教授是加拿大工程研究院院士(Fellow of the Engineering Institute of Canada),IEEE Fellow,Institution of Engineering and Technology(IET)Fellow,IEEE傑出講者,IEEE車載技術學會理事(2016- 今),副主席(2017- 2019)。連續3年入選科睿唯安計算機科學領域“全球高倍引科學家” (2019- 2021)。Google學術20,000+次引用,H- index88。研究領域為互聯自主智能,區塊鍊,機器學習,自動駕駛及無線網絡。擔任多個國際期刊編輯。多個科研成果及論文獲獎。2021年,于教授來到深圳,出任人工智能與數字經濟廣東省實驗室(深圳)(光明實驗室)執行主任。

于教授的主要研究方向包括:聯網自動駕駛汽車(CAV),機器學習與人工智能,區塊鍊和分布式賬本技術,無線網絡實體系統和網絡中的安全和隐私等。

為了能将于教授的精彩演講"原汁原味"地呈現給大家,新智駕做了不改變原意的編輯。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

今天我的報告題目相對抽象,是《互聯:從品質、能源、資訊到智能》。

我将“以車為例”進行彙報。第一部分是背景知識——互聯和自動車輛。二是分層設計、跨層設計、跨系統設計。三是人工智能在資訊中互聯的方法。四是報告的主題,以聯網的角度,從“大尺度”考慮網聯,可分為品質互聯、能源互聯、資訊互聯和智能互聯。第五部分為總結。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

互聯與自動車輛

自動駕駛的巨大影響不限于車和路,對整個社會而言影響也非同一般。每天早晨我們也許會思考:到底是我駕駛車,還是車駕駛車。

幾年前人們對自動駕駛的前景比較樂觀,為什麼提到自動駕駛?人們說起人工智能時,其中大多應用主題就是“将來不用自己開車了”。

和大家展示兩張非常有趣的圖檔。

第一張圖:1900年美國的第五大道Easter早晨車水馬龍,請問大家能看到汽車嗎?1900年攝影技術有限,大家可能看不太清,但是有一輛汽車的,也隻有一輛,其他都是馬車。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

第二張圖,是1913年,13年之後也是同樣的一天在美國紐約第五大道Easter的早晨,請問照片上還能看到馬車嗎?不,已經全部都是汽車了。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

他們用兩張圖的對比表達一個事實,當技術想抛棄你的時候,連聲招呼都不打。用這個類比是為了說明将來自動駕駛也會像之前汽車代替馬車一樣快速的疊代。在前幾年的時候,這些人用在融資和技術報告裡去說服投資者:自動駕駛很快會實作。

雖然理想很豐滿,現實卻是非常殘酷的。大家可能聽聞過國内外各種各樣的例子,尤其是特斯拉、UBER和一些大廠出現的人為事故,包括引起廣泛關注的特斯拉不能識别白色物體的問題,進而導緻各類事故。

Waymo的CEO也曾給大家潑了一盆水,Waymo是谷歌自動駕駛的子公司,是以Waymo在自動駕駛領域是有發言權的,從2009年開始,Waymo的自動駕駛車輛在真實道路上一共跑了超過2千萬英裡和在虛拟環境下跑了20億英裡。但是Waymo的CEO說自動駕駛幾十年之内都不可能大規模的出現在真實交通中。問題出在哪兒?

他最近評論,Technology is really really hard,技術太困難了。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

Elon Musk2021年七月也有過著名的評論。人們都在問他,你早先說全自動駕駛很快就能實作,到底什麼時候能實作?然後Musk把這個“球”推到學術界和産業界的工程師和科學家面前,他說:“這不是我的問題,不是我做不出來,是科學界沒有解決人工智能科學的問題。” 他把“責任”推脫到了學者身上。

是以做不出來自動駕駛跟特斯拉關系不大,是“我們”的問題。

我作為學者、工程師看到這句話其實有所欣慰,從消費者來的角度,大家看到會将關注落在“自動駕駛不會短期内實作”這一點上,但是作為學者、工程師來講,我們看到了機會,為什麼?全部都做好以後就沒有機會了,如果做不好的話我們還有機會實作它。

是以我一直在思索到底是什麼問題?大家衆說紛纭。本質而言,資訊跟智能是有很大差别的。什麼差别?自動駕駛的車一天能産生5T資料,各種各樣的傳感器都在生産大量資料,比如相機、GPS、LIDAR等。但對自動駕駛而言,這些資訊不等同于智能。智能在這裡我定義為「開車這件事情」,像可以轉向、刹車、油門。

分層設計、跨層設計、跨系統設計範式

我想簡單介紹下在資訊網際網路時期我們的設計方式。它在通信網絡裡屬于自動駕駛裡的基礎設施,我們一般使用DSRC,或者是C-V2X。

在資訊網際網路裡我們用什麼樣的設計範式?

最早是分層式的優化方式,即每層都處理單獨的任務,比如實體層的功率、AMC(adaptive modulation and coding),MAC層處理不同的使用者分級、RLC處理重傳、非重傳、可靠性;PDCP處理包的壓縮;RRC(Radio Resource allocation),CELL Selection、Handover、Admission等優化都是在這一層。applications這部分也可以優化,像用哪種codec,H.261或者H.262。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

使用者也能參與其中,這就是幾十年前的優化方式,但分層優化不能滿足整個的系統要求。後來出現跨層優化,即把各個層聯合起來優化。例如上層和下層聯合起來優化,效果更好。

舉個例子,應用層傳輸實時資訊或自動駕駛的控制資訊,對時延要求高。實體層有實時的網絡資訊,聯合優化會産生良好效果。下一步進展是跨系統優化,通信和網絡變成子系統,其他子系統也很重要, 比如計算系統,考慮的是邊緣計算、雲計算、物計算。另外一部分是存儲,請不要忽略控制部分,它不是傳統通信和網絡所做的内容,另屬其他子系統。

這裡将通信和網絡歸為一個子系統,聯合起來優化是十分必要的。為什麼這樣講?因為不同的applications。比如自動駕駛,或者現在比較火的元宇宙、AR, VR,對計算有較高需求,隻有網絡無法滿足整個系統的需求。對多媒體傳輸而言,在存儲、緩存方面的要求更多。我總結為跨系統設計。

對此,回顧我們做過的一些工作。

通信計算相結合的工作;

通信、計算和緩存相結合的工作;

通信和控制相結合的工作。

每次結合都會提升網絡或系統的性能。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

當我們寫文章時,性能提升高是特别高興的事情。但大家不要忘記随之而來的“慘痛代價”。其中一個代價是複雜度大幅提升,從單層設計到跨層設計再到跨系統設計,每次考慮的參數越來越多。大量參數放在一起優化,雖然系統性能有所提高,但維數災難也會伴随而生,也可以被稱為第一個“詛咒”。

另一個問題是Curse of Modeling(模型災難),即「如何模組化」。一層模組化不複雜,多層模組化、跨系統模組化、跨不同網絡模組化卻十分麻煩。幾乎模組化中都會産生問題,有句名言:All Models Are Wrong.模組化和真實環境有不可忽略的差别。

是以有兩個curses:Curse of Dimensionality和Curse of Modeling。

AI Approach

因為模組化困難和複雜度越來越高,我們希望能夠用人工智能的方式解決網絡優化問題。

我們的會議主題是「全球人工智能與機器人大會」,在座各位或多或少都是與人工智能有關聯的人。AI并不是新概念,"人工智能"是1950年被提出,1980年開始機器學習,一直到2010年效果優越的Deep Learning(深度學習)出現。

當時為什麼不能提及人工智能?圖靈獎得主Hinton教授,當年從美國"出走"到加拿大,也是因為遇到“人工智能寒冬”。Hinton教授一直沿着機器學習和神經網絡方向研究,2012年終于有所突破。人工智能的發展并非一帆風順,可以說是幾起幾落。

我們較多用Reinforcement learning(強化學習)。機器學習可分為三類:監督學習(Supervised learning)、 非監督學習(Unsupervised learning)、 強化學習(Reinforcement learning)。

圖中左下的文章是2004年我發表的博士論文最後一章。它也是我一個慘痛經驗教訓的具象。當時用機器學習或強化學習是沒辦法發表頂會文章的,因為大環境并不認可。「人工智能」彼時屬于貶義詞,被認為是垃圾輸入、垃圾輸出,不能産出Insight,沒能獲得業界和學術界的承認。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

強化學習是我本人非常喜歡的算法,主要因為它可以做廣泛的“動作”,控制車、控制網絡或控制各式各樣的參數。

Deep Reinforcement learning(深度強化學習)中心思想很簡單:模拟動物或人跟環境互動的過程。深度強化學習可以解決很多"大問題",其中之一就是Alpha Go。

Alpha Go的核心思想是運用強化學習解決問題。強化學習技術和加拿大淵源頗深,深度學習是圖靈獎得主Hinton教授主導的。強化學習是加拿大另一位學者Richard Sutton主導的。

用AI approach,用跨層設計、分層設計、跨系統設計,并不是毫無問題。

資料十分重要。現代人工智"茁壯成長"起來的根基就是Data-driven(資料驅動)。Data-driven在幾年前是褒義詞,它不是全部從模型而來,而是存在真實資料的。但許多小團隊、小公司等相對較難獲得大資料。Data driven另一種形式的解讀:Big data導向big intelligence,Limited date導向Limited intelligence。

回到自動駕駛這一話題,世界道路千萬條,人類無法讓模型具體學習到每個路口、每類天氣情況、每種司機的駕駛條件,資料不足也是自動駕駛目前未能大規模商用的重要因素。前面說到資料驅動,因而Limited data就是Limited intelligence。其他挑戰還有data inefficiency(資料使用率低效),需要大量的資料訓練。Poor generalization, 泛化能力較弱。Lack of interpretability,可解釋性差。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

出現問題卻不知原因。一方擁有大規模網絡資料時能不能與他人分享?機器之間的share intelligence是需要特定語言、程式進行。

我認為,目前的機器學習、人工智能有點像動物學習。

2019年《Nature》的一篇文章提到:現在的人工智能也許不及動物。其中一個例子,也是我們中文耳熟能詳的俗語“龍生龍,鳳生鳳,老鼠的孩子會打洞”。描述的正是生物基因裡面已經存在的技能。一如文中:Learning is NOT very important. 這篇文章無異于給我潑了盆冷水。我們研究人工智能和機器學習也有一些時間了,如果AI不如動物,更不能和人相提并論。

後來我希望能從書中獲得答案,了解動物和人之間的根本差別。對此,《人類簡史》解答得十厘清晰。《人類簡史》中有個颠覆性的觀點:人和動物的主要差別就是「Gossip」,即"八卦能力"。

為什麼是"八卦能力"?人類可以傳遞并不真實存在的資訊。像在公司裡“傳”閑話,WeChat、Keynote,甚至于今天的分享報告,都是一種“八卦能力”。我們隻能和同類講,不能跑到森林裡和動物們做報告。

“八卦能力”的說法不太正式,是以我找到另一種正式說法—Collective Learning(集體學習),Big history project (大曆史項目)中許多曆史學家同樣疑惑:人為什麼比動物更加聰明?回顧從大爆炸到人類進化到現在,得出基本結論就是Collective Learning。

Collective Learning的第一步都是從資料學到的,資料驅動也是目前人工智能和機器學習的基本思想。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

第二步、第三步之後,機器和動物基本不具備把智能存儲下來的能力,隻有人可以做到。我們可以潑墨揮毫寫文成書,這是人類才有的特殊能力。與《人類簡史》裡說的"八卦能力"異曲同工,人可以相信不存在的資訊并分享智能。以上兩點,非正式說法「Gossip」,正式說法「Collective Learning」。

大家可能會問:現在人工智能可以擁有「八卦能力」嗎?或向其他智能體進行學習嗎?目前而言十分困難。因為沒有Incentives(激勵)、trust(信任)、Language(語言)。如何實作這些能力?這就是我們的下一主題,品質、能源、資訊、智能。

互聯:從品質、能源、資訊到智能

愛因斯坦說過:You cannot solve a problem on the same level that it was created. You have to rise above it to the next level. 這句話令我感觸頗深。"當你遇到問題時千萬不要在問題同等水準上思考它,應該提升到另一個層次上考慮",進而産生新靈感。這也是我今天彙報的主題,從"大尺度"考慮網聯。

許多媒體報道,包括Elon Musk也認為,人類曆史上最大的發明創造是車輪。車輪的本質是品質的互聯,它可以把有品質的東西快速、高效地在兩點間傳送。車輪促使交通網絡的形成。第二個重要發明是能源的互聯,以前的汽油和現在的電能,都屬于能源互聯。第三個重要發明是人們樂享其中的網際網路,它是資訊的互聯。簡而言之,“車”見證了人類曆史整個技術的發展路線。從最初的運輸品質,随後是使用能源,到現在的資訊聯網。

以發展角度看,Abstraction(抽象)在一層一層的提高。我們心生疑惑,将來會如何進階發展?疫情期間經過長時間思考,我寫下一篇文章。在優化網絡時的分層設計、跨層設計和跨系統設計,歸根到底我們是在做一件事情,傳遞資訊。這也是我們所說的Internet of information,讓資訊從A點移到B點。

特斯拉發明了交流電,可以了解為是傳遞能量。當下資訊發展過載,鋪天蓋地的資訊無處不在地充斥着我們的生活,擷取資訊對現代人而言易如反掌。是以我在文中推斷,這是一種intelligence(智能)的缺乏—— 拿到資訊該如何運用。比如一個自動駕駛車,每天可以獲得5T的資料,手握巨量資料,車技卻依然不高。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

那目前能實作move intelligence(傳遞智能)嗎?暫時不能。但我們可以考慮用Blockchain(區塊鍊)解決相關文通。《哈佛商業評論》曾發文,問曆史中是否出現過類似Blockchain的事物?答案是有的,就是TCP/IP(傳輸控制協定/網際協定)。

首先它們都是分布式的,分布式的優勢在于集中式促進創新,也可以支援大規模其他應用,這是TCP/IP和Blockchain的相似之處。Blockchain應用繁多,我們的國家級報告裡常把Blockchain視為數字經濟的重要技術手段。

我們近期有出版關于區塊鍊的書籍——《區塊鍊:原理、架構與應用》和《Blockchain Technology and Applications》;以及區塊鍊研究的網站vDLT. io;還有區塊鍊優化問題,我們提起Blockchain多是實作方面,優化方面較少。

為什麼人比動物更加聰明,答案指向一點—— Collective learning approach(集體學習研究),我們近期所做也是希望通過區塊來實作集體學習。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

從車的角度做智能網聯。我在文章中有提出雛形,它也是元宇宙的雛形,每個車都對應到元宇宙裡的“數字孿生”車,并在其中分享智能。

另外一個是算法方面的創新,Collective Reinforcement Learning,基本思想也是模仿人類。強化學習原是單個智能體,現在多個智能體互相融合、學習、實作智能網聯。

對于當下和将來面臨的挑戰。挑戰看似容易,隻需傳遞智能。但實踐中頻頻受阻。從資訊論而言,為什麼資訊可以輕易“挪來挪去”,我們的網際網路為何能高速發展?關鍵在于資訊的定義和描述。眼下對整個Intelligence的描述是十分艱難的。也是比較難攻克的問題。

未來趨勢:智能互聯

Internet of Information可以用分層、跨層、跨系統的設計,最近比較流行用AI approach。我們認為Internet of Intelligence(智能網聯)是未來趨勢,對機器和人而言,作出正确決定更加重要。共享智能不僅僅是技術問題,也是經濟的問題。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

我們的人工智能與數字經濟廣東省實驗室(深圳)剛剛成立不到一個月。因為落戶在深圳市光明區,是以起名光明實驗室,是廣東省政府準許籌建第三批省實驗室之一。

我們目前主要聚焦四個方面:一是區塊鍊與金融科技;二是智能傳感與精準醫療;三是機器學習和智能系統;四是泛在感覺與智慧城市。再次感謝大家,歡迎各位到我們實驗室指導工作。

加拿大工程院院士于非:從“自動駕駛”到智能互聯

END

加拿大工程院院士于非:從“自動駕駛”到智能互聯

「無人」駕駛,正在遭遇「用人」荒

加拿大工程院院士于非:從“自動駕駛”到智能互聯

自動駕駛「感覺」的革新?從人腦和蛙眼得到的啟示

繼續閱讀