天天看點

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

根據科學研究,人類大腦皮層的70%活動都在處理視覺資訊。如果人工智能賦予機器能夠像人類一樣思考、處理事情的能力,計算機視覺将承擔巨大作用。作為一門研究如何使機器“看”的科學,計算機視覺已成為人工智能的重要分支,等同于人工智能的大門。

提到計算機視覺研究,就不得不提起近年來一個冉冉升起的“學術新星”——何恺明。從聯考滿分狀元到“CVPR最佳論文獎”第一位華人得主,再到“深度殘差網絡”在ImageNet比賽中擊敗谷歌等公司奪得第一……“80後”的他早已衆多光環加身。在學界,他被視為天才少年,也被稱為“大神”,不斷地為學界提供着諸多有分量的研究成果。

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

何恺明

從小就成為“别人家的孩子”

用“年少成名”形容何恺明一點不為過,因為他曾是萬千學生和家長都膜拜的對象——聯考狀元。

出生于廣州的何恺明是家中獨子,父母均在企業裡從事管理工作,從小就接觸到優良的教學環境。實際上,能從衆多學子中脫穎而出,除了教學環境之外,更多的是靠自己的努力。

何恺明年少時就被送到少年宮學習繪畫,有時一待就是大半天,這也不斷使他練就出沉穩的性格。同繪畫一樣,他對于文化課的鑽研也十分耐得住性子,學習成績優秀而且穩定。在老師的心目中,他是一個“性格比較内向”但是“目标明确”的學生,“從小就立志上清華”。

高中時,何恺明憑借全國實體競賽一等獎被保送進清華大學機械工程及其自動化專業。不過,他卻依然選擇繼續參加考試,并憑借着紮實的基本功和輕松的心态一舉成為2003年的廣東省聯考狀元。

憑實力進入清華的何恺明,放棄了原本保送的專業,轉而選擇了更有挑戰性的基礎科學班。成立于1998年的基礎科學班是清華大學設立的一個跨系跨學科的尖子班,大學學生不僅要學習實體系、數學系的大部分基礎課程,還要接受一定的科學研究的實際訓練。

大學期間,何恺明繼續着自己沉穩而優秀的表現,不僅連續3年獲得清華獎學金,2007年,還未畢業的他就進入了微軟亞洲研究院(MSRA)實習。

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

何恺明和導師湯曉鷗

大學畢業後,他進入香港中文大學攻讀研究所學生,師從AI名人湯曉鷗。同時繼續參與MSRA的工作。2009年,他的第一篇論文“Single ImageHaze Removalusing Dark Channel Prior”被計算機視覺領域頂級會議CVPR接收并被評為年度最佳論文,這是CVPR創辦25年來華人學者第一次獲此殊榮,也使何恺明在CV領域聲名鵲起。

受遊戲啟發的CVPR最佳論文

然而,彼時剛剛涉足CV領域的何恺明,卻并非一帆風順。

在MSRA實習時,他并未選擇自己擅長的實體和數學工作組,而是根據自己的研究興趣選擇了形象計算組。盡管他曾在大學的時候選修過計算機圖形圖像的相關課程,但是并非科班出身的他,興趣也難以支撐工作的需要。

背景知識的缺乏使他在入門的路上舉步維艱。回憶起那段時光,何恺明曾表示,自己在閱讀文章的時候,常常都不知道哪些是大家都在用的方法,哪些才是作者的貢獻。一切對他來說都是新的。

盡管有導師孫劍這樣的學術大牛帶着他進行課題研究,自身穩定而刻苦的品格也推動着他不斷挑戰困難,但在換過多次課題後,全部都以失敗告終。

雖然結果對何恺明來說是殘酷的,但是他也從中學習到了很多,尤其是多個研究課題的經曆使他嘗試了許多不同的方向,而MSRA輕松自由的研究方向也為他日後的科研奠定了牢固的基礎。

其中,何恺明花了大量時間研究的image matting問題 (半透明物體邊界提取),就為他日後研究的“去霧算法”帶來很大幫助。在剛開始研究去霧的時候,何恺明發現霧的方程和matting的方程非常相似,而之前所研究的matting架構可以給去霧帶來幫助。利用這個架構,隻需要找到一個能局部估算霧的濃度的方法就足夠了。

他在2009年獲“CVPR最佳論文獎”的那篇論文,研究的正是圖像的去霧技術,它可以還原圖像的顔色和能見度,同時也能利用霧的濃度來估計物體的距離,這些在計算機視覺上都有重要應用(例如三維重建,物體識别)。

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

北京灰霾照片的去霧結果

難以想象的是,他最初對去霧研究的靈感竟是來源于電腦遊戲。何恺明發現,3D遊戲裡有很多帶有霧的場景,但這些場景都是虛構的不實在的東西。計算機生成的3D圖像會與自然圖像的統計規律有很大差別,但人的視覺系統卻仍然能感覺到虛拟圖像中存在的霧。這讓他相信,人的視覺系統一定有一種有效的機制來感覺有霧的圖像,而且這種機制一定與現存的去霧方法不一樣。

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

根據何恺明算法處理的圖像,上為原圖下為處理後

與之前的方法不同,何恺明把注意力放到了無霧圖像的統計特征上。在無霧圖像中,每一個局部區域都很有可能會有陰影,或者是純顔色的東西,又或者是黑色的東西。是以,每一個局部區域都很有可能有至少一個顔色通道會有很低的值。他把這個統計規律叫做Dark Channel Prior。

即使有了想法和實驗結果,第一次寫文章也使何恺明覺得非常困難。他經常陷入自己和自己吵架的角色當中。在每一段話寫好之後,常常會質問自己事情到底是不是這樣的,這其中有沒有漏洞。他也會思考,如果自己是評委,或者是讀者,能看懂這篇文章嗎,怎麼寫才能讓思路更加流暢?

就在這樣的掙紮中,何恺明的一稿通常要寫好幾天。每當他把自己說服了,孫劍還是總能提出新的質疑。就在這樣的循環中,終于有一天孫劍說文章已經寫得不錯了,他才開始具體的修改。正是這樣的苛刻要求,才會有後來高品質的文章。

因為熱愛,是以一次又一次選擇走研究的路

2011年,博士畢業的何恺明正式加入MSRA計算機視覺和深度學習的研究工作。在2015年的ImageNet圖像識别大賽中,何恺明和他的團隊憑借152層深度殘差網絡ResNet-152,擊敗谷歌、英特爾、高通等業界團隊,榮獲第一。目前ResNets也已經成為計算機視覺領域的流行架構,同時也被用于機器翻譯、語音合成、語音識别和AlphaGo的研發上。

2016年,何恺明憑借ResNets論文再次獲得CVPR最佳論文獎,也是目前少有的一人兩次獲得CVPR最佳論文獎的學者。

後來,何恺明和孫劍相繼離開MSRA。與孫劍的選擇不同,何凱明走得還是那條學院路。他選擇了去Facebook,擔任其人工智能實驗室研究科學家,選擇了進一步走學術之路。

在Facebook AI實驗室研究期間,何凱明仍然醉心于研究,而且頗有建樹。2017年3月,何恺明和同僚公布了其最新的研究Mask R-CNN,提出了一個概念上簡單、靈活和通用的用于目标執行個體分割(object instance segmentation)架構,能夠有效地檢測圖像中的目标,同時還能為每個執行個體生成一個高品質的分割掩碼。同年,憑借《利用焦點損失提升物體檢測效果》這篇論文,他一舉奪下了另一個計算機視覺頂級會議ICCV最佳論文獎。

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

ICCV 2017最佳論文

2018年,何恺明在美國鹽湖城召開的CVPR上,獲得了PAMI青年研究者獎。幾個月前,何恺明等人發表論文稱,ImageNet預訓練卻并非必須。何恺明和其同僚使用随機初始化的模型,不借助外部資料就取得了不遜于COCO 2017冠軍的結果,再次引發業内關注。

無論是在MSRA還是在FAIR,何恺明始終以他沉穩而優秀的表現,一路過關斬将,為學術界帶來許多重磅的研究成果。有人曾表示,孫劍選擇加盟企業,而何恺明似乎還在不知人間疾苦地奮鬥在研究領域,但是雖然道不同,最終為行業所做貢獻卻是相同的。

何恺明:從聯考狀元到CV領域年輕翹楚,靠“去霧算法”成為“CVPR最佳論文”首位華人得主...

繼續閱讀