天天看點

朱松純:強認知AI的領路人

作為一家強認知 AI 平台公司和這個領域的開拓者,暗物智能極大填補了目前主流市場強認知 AI 的技術和商業空白。而一手創辦這家公司的全球著名計算機視覺專家、統計與應用數學家、人工智能專家朱松純教授,也是計算機視覺領域的華人之光。

朱松純:強認知AI的領路人

朱松純與美國加州大學洛杉矶分校(UCLA) 計算機視覺、認知、學習與自主機器人中心(VCLA)的 Tony 機器人,後者代表了 VCLA 緻力于解決內建人工智能、視覺和機器人技術問題。方法是建構一個可以檢視真實世界的系統,了解它看到的東西,并根據這種了解采取行動。

如果說有誰能将計算機視覺與交叉科學關系演繹得最為深刻與精彩,朱松純一定當仁不讓。

除了三次問鼎計算機視覺領域國際最高獎項——馬爾獎,作為新一代人工智能領軍者,朱松純兩次擔任美國視覺、認知科學、AI 領域跨學科合作項目 MURI 負責人,長期緻力于建構計算機視覺、認知科學、乃至人工智能科學的統一數理架構。

除了對視覺領域大方向有着一流的直覺和準确把握,朱松純也一直往返于大學、公司、非營利機構,希望打通大學、研究院、産業的關節,貫穿産學研。

他籌建了世界最早大資料标注團隊,釋出了精細化程度最高、語義資訊最豐富的大規模資料庫 LHI Dataset;他一手建立暗物智能,填補了目前主流市場強認知 AI 的技術和商業空白,讓普羅大衆都擁有屬于自己的 AI。 2020 年 9 月,朱松純以國家戰略科學家身份受邀回國,籌建北京通用人工智能研究院并擔任院長,同時擔任清華大學、北京大學講席教授、北京大學人工智能研究院院長。将人工智能大一統理論架構在中國「圓夢」。

 出國求學:逐夢「大一統」

1986 年,朱松純考入中科大計算機系。當時,人工智能正陷入長達 30 多年的低谷(所謂 AI 的冬天),但他很早開始選修人工智能研究所課程。

不同于做着布朗運動的功利主義者,成長在改革開放年代的朱松純這一代人充滿理想,崇尚科學,有着一種理想主義和使命感。

在他看來,人工智能有太多問題需要解釋,值得長期探索。如果說在大學做研究是練内功,那麼在工業界練的就是外功。無論是上山創立門派還是下山開镖局,都要内外兼修,相輔相成。

當時,人工智能基本還是以符号為主的推理,離現實世界很遠,研究人員也很悲觀,失望之餘,在資訊閉塞、沒有電郵和網際網路的 80 年代,朱松純通過自己查閱以及跟留學美國老師談話,接觸到神經科學、心理學、認知科學、神經網絡等方面的知識,也與計算機視覺不期而遇。

 1989 年冬天,寒假回家之前,認知科學實驗室的一位老師借給朱松純一本白皮書,作者是 David Marr,他是英國出生的 MIT 認知科學和神經科學家,也是公認的計算機視覺的創始人。 美國是在 1980 年左右開始創立計算機視覺這門新興學科,當時國内大多數學計算機的人根本就沒有聽說過。因為缺乏背景知識,朱松純當時基本讀不懂這本書,但這也成為朱松純學術生涯的起點。

 「誤入」計算機專業之前,朱松純填報的志願其實是實體。實體學發展猶如追求實體世界統一的宏偉史詩,念念不忘實體之美的朱松純也希望用這樣的「大一統」理論解決人工智能問題,「來構造這個世界最合适于他的風範的、簡約的、可以了解的畫卷」。(「to make for himself in the fashion that suits him best a simplified and intelligible picture of the world。」——愛因斯坦語)

 1991 年,朱松純從中科大計算機專業畢業。當時,計算機系剛剛有了第一台雷射列印機,替代針式列印。朱松純買了兩包「佛子嶺」香煙給管機房的師兄,讓他一定幫忙把申請海外高校的個人陳述好好排版,列印出來。三頁紙陳述中,朱松純要探索一種計算機視覺統一架構。 大部分學校拒絕了申請,結果哈佛大學錄取了他。90 年代,計算機視覺處于混沌初開、大家都在找「北」的時期。哈佛大學、布朗大學這個學派( Pattern Theory 學派)認定了用機率統計模組化和計算的方法來研究。

朱松純的導師 David Mumford 正是後來人工智能研究轉向機率統計這個新體制的重要舵手之一。 Mumford 以前研究代數幾何(Algebraic geometry)并于 1974 年獲菲爾茲獎。1980 年代從純數學轉來學習、研究人工智能。Mumford 認為統計是解決視覺問題的關鍵,并緻力于建立模式理論(Pattern Theory),為智能建構一個數學體系(mathematics of intelligence)。當他看到朱松純申請時,發現兩人目标一緻。

朱松純:強認知AI的領路人

1996 年布朗大學宣傳圖檔。朱松純與導師 David Mumford 追逐計算機視覺的統一計算架構。

求學期間,朱松純一直與導師追逐計算機視覺的統一計算架構。 朱松純率先将機率統計模組化與随機計算方法引入計算機視覺研究。在導師建議下,朱松純基于歸約思想将大問題分解成小問題,從具體問題入手,為 David Marr 提出的早期視覺 (early vision)概念, 包括紋理 (texture)、圖像基元 (Texton)以及原始簡約圖 (primal sketch)等建立一個統一數理模型,使從純粹理論、計算角度研究計算機視覺成為可能。 句子要符合文法結構,視訊中的一個事件也有文法結構,尋找這樣一個階層化、結構化的解釋正是計算視覺的核心問題。

2000 年前後,朱松純提出圖像解譯(image parsing)與視訊解譯,把視覺問題全部納入一個統一架構來求最佳解,擴充了模式識别創始人傅京孫先生的句法模式識别理論,并于 2003 年問鼎計算機視覺領域國際最高獎項——馬爾獎。 2002 年,朱松純加盟美國洛杉矶加州大學(UCLA),任統計系與計算機系教授,計算機視覺、認知、學習與自主機器人中心主任。在他之前,僅有 Judea Pearl 在 UCLA 計算機系和統計系兼職教授。

涉足人工智能領域近 30 年,朱松純已在國際頂級期刊和會議上發表論文 300 餘篇,三次問鼎馬爾獎。作為視覺領域行業領軍人物,也打破了華人在國際頂尖期刊話語權微弱的局面。

2019 年 6 月,受中美貿易戰影響,美國政府對華為進行制裁,華為員工也被 IEEE 禁止參與審稿。不久,大會官方發表聲明「力挺」華為。作為這屆大會唯一一位華人主席,朱松純也在這封公開信上署名,聯合申明抵制 IEEE 限令,強烈倡導會議主席、編輯們自由選擇論文的審裁權利。

科研攻堅:引領技術範式新方向

提前感覺未來大方向,正是頂級研究者的厲害之處。

過去幾十年間,每一次重大轉折都是因為計算機硬體革命,帶來新穎的重大工程問題。90 年代末期感覺器革命,讓朱松純預見變革即将到來——因為有了資料。 2005 年,朱松純回到老家湖北鄂州,帶頭成立蓮花山計算機視覺研究院,并籌建了世界最早大資料标注團隊。他們雇了幾十位平面藝術等專業的年輕人标注圖像,座椅、椅背、腿的輪廓要标得很準确,連杯子和蓋子都要分開标記。朱松純認為圖像必須标記得非常細緻,還制定了 200 多頁标記手冊。

十幾個人一直标資料,做了三年,資料庫也隻有幾十萬張圖檔。而且到了後來,朱松純也回答不出如何标記。正是在這一過程中,他洞察到機器學習和大資料方法的局限性,「AI 作坊」注定不是通向通用 AI 的道路。

雖然自己是最早一批提倡統計模組化與學習的人,但後來朱松純看到了更大的問題和局勢——光解視覺問題是做不好的,還需要大量認知推理。

「沒有多少人有勇氣去嘗試這件事。」 Mumford 曾這樣評價朱松純,「他确實是當今世界上正在擴充計算機視覺概念,以涵蓋人工智能交叉學科重要問題的主要人物。」

2008 年之後,朱松純轉向認知領域的研究,将計算機視覺與認知科學、自然語言了解、機器人等學科結合,探索他所稱的「人工智能的暗物質」——占 95%、無法通過感覺輸入觀測到的物質。 比如,你看見了一把椅子,想象身體如何去坐,以及坐下來是否舒服,這裡面包括實體、功能、價值觀,這些都叫做「暗物質」;一個番茄醬瓶倒放的場景,這裡的「暗物質」就是在人們倒放瓶子這個行為中隐含的目的——為了更容易從瓶子裡擠出番茄醬。 

感覺的圖像僅僅提供一些蛛絲馬迹;而後面的 95%,包括功能、實體、因果、動機等等要靠人的想象和推理過程來完成。隻有把這 95% 搞定了,才能去了解剩下的 5%,否則,就隻能窮舉所有情況。

朱松純上司的 UCLA 計算機視覺、認知、學習與自主機器人中心(VCLA)也一直緻力于計算機視覺、機器人技術和人工智能的 AOG 表征和模組化。

AOG(與或圖)是一個複雜的機率文法圖模型,就像用腦皮層裡面學習到的大量的知識來解釋你所看到的「蛛絲馬迹」,形成一個合理的解。而這種 Top-down 的計算過程在目前深度多層神經網絡中是沒有的。

在朱松純看來,他們正在做的是面向 10 年、20 年後的技術——實作自然的(natural)智能。

朱松純:強認知AI的領路人

VCLA 的計算機視覺方法是定義一個視覺文法,并用它來解析圖像和視訊。上圖是一個示例圖像和一個可能的解析樹。

2011 年,DARPA「MSEE」項目提出一項挑戰,分析幾個小時從不同錄影機拍攝的視訊,并建立一個可以回答人類問題的系統。 DARPA 接受了由卡内基梅隆大學、加州大學伯克利分校和麻省理工學院等多所大學的研究人員組成的九個小組的方案,除了獲得高額資助,各小組還有四年時間實作自己的提案。 最後,隻有朱松純上司的 VCLA 還留在比賽中,并成功完成自己的提案。其他小組要麼因為沒有按時完成任務而被 DARPA 取消資格,要麼因為任務太困難而自願退出。

朱松純團隊做了一個視覺系統,視訊的了解輸出為一個大的綜合 STC-PG(它的母版就是一個 STC-AOG)。在此基礎上就可以輸出文字描述和回答提問 Q&A。這與後來一些計算機視覺的人研究 VQA 不同,後者是拿大量圖像和文本一起訓練的,基本是在「扯白」。

MSEE 項目的成功為 VCLA 堅持的技術範式提供了重要機構背書。

從 2010 年到 2020 年,朱松純連續上司兩屆大型跨學科國際專項 MURI,帶領來自 Berkeley、Caltech、CMU、MIT、Stanford、Brown、Yale 以及英國牛津大學的跨學科教授專家攻關人機互動認知理論、跨領域 AI 融合等新一代人工智能技術的難題。 

朱松純:強認知AI的領路人

MURI 項目的人員。朱松純帶領來自 Berkeley、Caltech、CMU、MIT、Stanford、Brown、Yale 以及英國牛津大學的跨學科教授專家攻關新一代 AI 技術難題。

不同的人對椅子感受不一樣,其實反映的是人的基本價值函數。為了解答這個問題,團隊研究人員用圖形學的實體人體模型模拟人的各種姿勢,計算出以這些坐姿坐在這些椅子上時,幾大身體部位的受力分布圖,由此推算出每個次元的價值函數,判斷人的價值觀,解釋人的行為。

2017 年,朱松純提出「小資料、大任務」範式,主張以此來實作通用人工智能,為探索通用人工智能的道路進一步指明方向。

投身産業:經世緻用,服務社會

科研上「清風明月」,但朱松純始終繞不過另一個關鍵詞——産業界。山上山下兩頭跑、遊刃于學術和工業界,不僅能看到全譜,對很多問題的體會也更深。

科研上著書立說之立言乃人生價值「不朽」之一。開發新産品、改變社會之「立功」同樣「不朽」。打造落地産品還需要朱松純邁出另一隻腳,跨過學術和産品之間的那扇大門。

如今,人工智能不僅處在科研領域黃金期,也正處在産業領域的黃金時期。麥肯錫全球研究院曾估計,到 2030 年,狹義人工智能應用将為全球經濟增加約 13 萬億美元,從金額來看,其影響力将超過 19 世紀的蒸汽機。

雖然産業界已實作了讓機器「能聽會說識物」,但直到今天,由于缺乏可解釋性,人工智能和機器人技術很難被廣泛應用在關鍵任務上。

朱松純團隊也一直在尋找能夠使機器人赢得信任的有效方法。2019 年,他們在 Science Robotics 雜志上發表的一項研究表明,機器人經過幾輪人類示範後,不僅知道如何用安全鎖打開藥瓶,而且還可以多種方式實時地解釋其行為。

在吉富創投 TMT 投資負責人李健全看來,這一波人工智能浪潮有一個很明确的趨勢,就是「沿着弱人工智能往強人工智能、超人工智能一路疊浪前行。」

投資已經開始。總部位于西雅圖的研究公司 Mind Commerce 曾釋出報告顯示,預計到 2023 年,通用人工智能的投資将達到 500 億美元。對于全世界最大的科技公司來說,通用人工智能是一場輸不起的比賽,即便結果證明沒有人赢。

2018 年底,暗物智能落戶中國廣州,将人工智能在認知層面的新突破應用于智慧教育等關系國計民生的重要領域,以實作真正的高自然度人機互動和協同。 朱松純曾表示,教育是關乎國計民生、人口素質和社會發展均衡化的重要領域。而人工智能通過對教育過程的認知模組化,可以助力提升教學和評估的效率,為基礎和職業教育提供低成本解決方案。

目前,暗物智能在教育領域已形成學齡前、K12、線上教育、職業教育的使用者服務全生命周期閉環,觸達數百萬終端使用者。

歸國「圓夢」:貫通産學研

目前,我們面對的是全新的問題,要研究的都是大型的複雜系統,如人工智能、神經與腦科學、生物系統、社會學。西方過去十分成功的 reductionism 思維方式是否需要掉頭,融合東方哲學和綜合的思想?

科研上,朱松純已經敏銳捕捉到發現最近 60 年,科學的發展缺乏大的架構性的突破,這與 1900 年代初期的大突破時代不同。

而從産業角度來看,如今國内 AI 産業在 2016 年快速發迹後正步入一個新階段,人工智能也被寫入國家戰略,AI 新基建正為衆多産業換代更新帶來新的機遇。

AI 産業本質上是人才和技術的競争,中國 AI 産業整體還面臨着人力資源的大量短缺。這幾年,已經有一些重量級學者接連回國,以不同的身份與角色投身這次浪潮。

對于朱松純來說,是時候開啟一次新的征程,正如三十年前遠赴哈佛大學求學,探尋新的挑戰,去思考為學界、産業、為下一代人工智能領域的學子們做些什麼。

2020 年,朱松純以國家戰略科學家身份受邀回國,籌建北京通用人工智能研究院(BIGAI)并擔任院長。這也意味着「小資料、大任務」的方法,也被定為北京通用人工智能研究院的「研究範式」。

朱松純曾在訪談中提到,三十年前就讀于中國科學技術大學時,就有了追求人工智能大一統理論的夢想,赴美求學正是為了追尋與探究這一理想。三十年後,選擇回國也是基于同一夢想,回歸初心——将人工智能大一統理論架構在中國「圓夢」。