
來源: Robinly
資料猿官網 | www.datayuan.cn
今日頭條丨一點資訊丨騰訊丨搜狐丨網易丨鳳凰丨阿裡UC大魚丨新浪微網誌丨新浪看點丨百度百家丨部落格中國丨趣頭條丨騰訊雲·雲+社群
本期Robin.ly AI訪談特邀平安科技美國研究院院長韓玫博士,在美國長灘CVPR 2019會場分享她在計算機視覺領域的研究經曆、以及平安研究院将AI技術應用于傳統産業的商業化實踐。
平安科技研究院是世界50強金融巨頭平安集團的創新技術研究機構,覆寫金融、醫療、汽車、房産、智慧城市五大生态圈。韓玫博士擁有清華大學計算機科學技術博士、和卡内基·梅隆大學機器人學博士學位。她曾經擔任美國NEC實驗室研究員、Google資深科學家,研究領域包括視訊分析、視覺跟蹤、物體檢測、幾何模組化、圖像處理、計算機視覺、多媒體處理以及計算機圖形學。
下文為Robin.ly主持人Wenli與韓玫博士的訪談實錄。完整訪談視訊見文末。
1
學術界與工業界合作
Wenli: 您是今年CVPR的企業關系主席。這個角色的責任是什麼?
韓玫:
我兩年前就做過這方面的工作。那一年是第一次把企業贊助和示範大規模地在CVPR做起來, 我們當時創紀錄地獲得了100 家贊助商的支援,今年的規模要大很多很多。我的職責就是聯系相關企業,在贊助企業與學術會議之間架起一座橋梁。
Wenli: 您如何看待您在學術界和工業界之間所建立合作?
韓玫:
我認為工業界和學術界的合作越來越緊密的根本原因是因為大資料時代需要兩邊的人共同合作推動行業發展。像谷歌和平安這樣的大公司有大量的應用場景和資料,需要解決很多實際問題,而學術界的人能夠幫助為這些問題提供解決方案。
Wenli: 您如何看待學術界和工業界的進步?哪一邊的發展更快?
韓玫:
學術界和工業界的科研發展肯定是有差別的。我 1995 年開始在卡内基·梅隆大學(CMU)攻讀博士學位,比較長期和理論的學術研究主要是在大學裡進行;公司做的更多的是以業務為導向的研發。1997 年,我在微軟研究院實習,2001年加入美國 NEC 實驗室。那時我們更專注于企業相關或業務驅動的工作。但現在學術界和工業界之間的界限變得更模糊了,學術界和工業界的人需要一起合作解決問題。
我們也看到了越來越多的教授和學生參與了工業界的研究工作。很多的教授會利用學術休假去工業界任職,讓自己的學生去公司實習。大型企業也會贊助學術研究,比如 Google Cloud 會為學生提供免費的會員資格,讓他們利用更高的計算能力實踐自己的工作。
2
雙博士研究經曆
Wenli: 您擁有清華大學和 CMU 的雙博士學位,有非常紮實的研究背景。您當時的博士研究課題是什麼?畢業後為什麼選擇去工業界?
韓玫:
那時候還沒有深度學習。我在CMU的博士論文做的是傳統的 Structure from Motion (SfM) 方法研究。我畢業後選擇進入工業界主要是因為在校園呆得太久了,我想将多年積累的知識和經驗應用到工業界解決實際問題。工業界的實驗室提供了學術研究和實際應用完美結合的機會。我先後加入了NEC美國實驗室,谷歌和平安的實驗室。在這三個公司的工作經曆都讓我受益匪淺。
韓玫在卡内基·梅隆大學,來源:韓玫
Wenli: 您在 CMU 的導師是計算機視覺領域的先驅,大名鼎鼎的Takeo Kanade。他對您的職業發展産生了什麼樣的影響?
韓玫:
他工作非常努力,在六七十歲的高齡仍然會工作到深夜,包括節假日,很多年輕學生都沒有他精力旺盛。他非常注重細節,會親自檢查我們的代碼、論文和報告幻燈片,并提出建設性的建議。他總是喜歡挑戰最難的事情,有一種不服輸的精神。
3
計算機視覺現階段的挑戰
Wenli: 您如何看待計算機視覺領域近二十年的技術突破?目前面臨的挑戰是什麼?平安的應對政策又是什麼呢?
韓玫:
這是一個資料驅動的時代,大資料、深度學習和強算力,特别是計算機視覺領域借助李飛飛的ImageNet,使得許多計算機視覺的傳統問題有了新的解決方法和思路。
目前計算機視覺面臨從感覺到認知的過渡,以及知識的表達和學習。
從應用角度來看,目前行業面臨的主要挑戰就是如何通過大資料來真正了解現實世界。我認為很多問題都可以在一定程度上運用大資料和深度學習來解決。我們現在迫切需要可解釋的人工智能技術,比如在金融和醫療的應用。這些傳統領域的商務人士和醫生真正關心的是大資料的工作原理,而不僅僅滿足于把它當作一個“黑匣子”,知其然而不知其是以然。是以如果要應用這些技術到傳統領域,讓它們真正發揮作用,我們仍然需要剖析深度學習背後的理論、原則和數學依據。
平安一直很重視這個領域的研究。矽谷研究院也有短、中、長期的研究方向和目标。我們會利用平安多年積累的豐富的領域知識和經驗,以及資料和場景,深耕深度學習的理論問題,比如可解釋性、泛化能力、知識表達。
4
AI技術商業化
Wenli: 能否介紹一下你們希望利用 AI 技術實作哪些商業應用?
韓玫:
平安的業務涵蓋了許多不同的領域,如醫療、金融、智慧城市。舉個例子,我們在進行一些視訊内容了解和智慧教育相關的工作,針對學生和老師的課堂行為分析,對于每個學生、老師,每節課、每個知識點,在多個次元整合統計資料,幫助孩子們更好地學習和老師更好地教學,做到真正地因材施教。同時可以把優秀的教學範例推廣到師資缺乏的偏遠地區,造福更多的學生和學校。
我們也從事英語口語教育方面的研究,通過評估孩子的英語詞彙量、交流語速以及發音是否準确這些細節資訊來幫助孩子們提高口語能力。
在計算機視覺領域,我們有多個圖像和視訊處理相關的項目。其中一個主要的項目是打造農業監督工具。我們使用遙感技術和衛星圖像來監測農作物的長勢,估算産量和預測災害帶來的損失,幫助農民更好地管理和規劃耕種。我們利用 NDVI資料,即多光譜圖像資料實作作物識别和産量預測,最大的困難是大量的資料标注的要求。這個獲得真實準确标注的過程就展現了平安,作為一個傳統行業和農業保險提供者的先天優勢。平安農險的同僚會根據NDVI資料的分析結果,收集、整理、擷取、采樣不同地理位置、環境、光譜等的實地資訊,這個标注本身就具有巨大的商業和科研價值,對于推動遙感影像技術的研發和應用,對于造福農業社群,都有深遠的意義。
Wenli: 你們下一步的計劃和長期目标是什麼?
韓玫:
明年我們計劃把研究院的規模從 30 名研究人員擴大到 40 到 50 人,專注于計算機視覺和語音文本的研究。平安矽谷研究院在建立之初,就設定了兩大使命:一是推動人工智能技術的發展,二是賦能平安的主要業務。
我們的長期目标是建立一流的工業界研究院。背靠平安強有力的支援,我們有決心深耕核心技術,建立長遠的研發目标,助力研究社群的發展,同時服務于來自平安内外的業務合作夥伴,他們的業務需求會階段性地驅動和驗證我們的研發成果,我們可以矯正和确定我們在朝着正确的方向努力。(完)