天天看點

處女作就拿下 KDD 雙料最佳論文runner-up,「半路出家」的他用深度學習研究氣候問題(附講解視訊)

第一次投遞論文,就中了 kdd,是什麼樣的體驗?

第一次投 kdd,不僅中了,還同時獲得了最佳論文 runner-up和最佳學生論文 runner-up,又是什麼樣的體驗?

這兩個知乎體問題,邀請東北大學 sds(sustainability & data science)實驗室的博士生 thomas vandal 來回答最合适不過了。他的處女作《deepsd: generating high resolution climate change projections through single image super-resolution》在 kdd 2017 上榮獲最佳論文 runner-up及最佳學生論文 runner-up,vandal 此外還獲得了 student travel award。

處女作就拿下 KDD 雙料最佳論文runner-up,「半路出家」的他用深度學習研究氣候問題(附講解視訊)

vandal 在會後告訴雷鋒網(公衆号:雷鋒網) ai 科技評論,之前他隻參加過一些 workshop,是以一開始并沒有想到這篇論文會獲得最佳應用類論文的 runner-up,「我們本來覺得可能會有機會獲得最佳學生論文獎,但這個結果的确出人意料。」

deepsd 這篇論文圍繞的是解決氣候分析的統計降尺度問題,團隊利用深度學習技術通過廣義的疊加超分辨率 cnn (srcnn) 架構增加多尺度輸入通道,生成有效的統計降尺度模型。(底部附論文摘要)

在 youtube 上,vandal 已經放出了關于這篇論文的介紹視訊,雷鋒網 ai 科技評論搬運視訊如下:

第一次投 kdd 就獲得如此出色的成績,讓 vandal 感到非常驚訝和高興,他表示這對自己而言是一個莫大的鼓勵。自然,第一次上台伴随的也有緊張。在論文展示現場,他在演講時舌頭有些打結,出現了不時的卡頓。或許大家也看到了他的局促不安,是以在問答環節的時候,隻有一位觀衆非常「友善」地提了一個不痛不癢的問題;同一場次至少要讓觀衆提三四個問題的主持人也沒有「刁難」他,很快地邀請下一位講者上台;在 vandal 演講完畢下台的時候,他抱着電腦快步離開,甚至忘記了把身上别着的麥克風摘下來遞給下一位講者;而當他回到後排座位上的時候,臉上終于流露出自然而放松的神色。

在演講過程中,vandal 也提及了模型自身依然存在一些缺點,包括了解雲、冰雹等氣象對氣候判斷的影響,還沒有在缺乏資料的地方檢驗模型的可預測性,在這樣的狀況下,要進行高分辨率的氣候分析則顯得更加困難。vandal 也表示,希望利用機器學習将模型變得更高效,且能夠适應更大範圍的分析。

處女作就拿下 KDD 雙料最佳論文runner-up,「半路出家」的他用深度學習研究氣候問題(附講解視訊)

「我們采用深度學習方法解決氣候問題的時候,實際上是在一個非常大的範圍内産生作用。而其中面臨的最大問題是面對氣候的海量資料源,我們需要關注使用者真正關心的資料是哪些,并将其進行模式化處理。可能對于商務人士或是政府人士,他們需要的内容可能會有差異。」

thomas vandal 向雷鋒網 ai 科技評論表示,深度學習的火熱對計算機科學而言,是一個深入研究領域知識的良好契機,就像自然語言處理現在也運用了深度學習優化模型結果一樣,反過來,它也能夠促進我們對領域知識的了解。「深度學習也提供了一種讓我們重新利用和審視資料的方法,值得所有研究者關注和思考。」

而根據 vandal 的說法,這篇論文很快将投遞到機器學習或計算機視覺的期刊上,在此之後會在大型計算機上進行試運作,最終将 120 個氣候模型投入使用并将結果開放給公衆。

作為一名正在研讀交叉學科工程的博士生,thomas vandal 實際上算得上是「半路出家」。2012 年在馬裡蘭州大學完成數學大學學習的他,畢業後在 boston technologies 擔任市場風險分析師,管理數百萬的外彙市場,随後在 affectiva 擔任資料科學家,開發了一款分析面部表情的工具。自 2015 年開始,vandal 開始在東北大學攻讀交叉工程學科,緻力于用深度學習研究氣候問題。

深度學習的應用有很多,但為何他會選擇氣候方向?vandal 表示,氣候領域是一個非常重要的方向,在未來的二十到五十年都可能會對全美國甚至全球産生普遍性的影響。「nasa 有很多衛星在監測各種有意思的氣象資料,我也和很多其它 nasa 成員在合作。」

目前,vandal 也在 nasa ames 研究中心實習,這篇獲獎論文也是與 nasa 研究員 sangram ganguly、ramakrishna nemani,還有劍橋大學的 evan kodra、university corporation 的 andrew michaelis 以及 vandal 的導師 auroop r ganguly 合作完成。他計劃在未來繼續對氣候問題進行深度研究,争取将自己的論文成果落地為成熟技術并盡快帶給公衆。

附論文摘要:

氣候變化的影響是由基礎設施、生态系統和發電廠等大多數關鍵系統所監測到的。然而,目前地球系統模型(earth system models,esm)的空間分辨率過低,是以并不适合本地化。統計降尺度(statistical downscaling)能夠通過對曆史氣候的觀測來學習低分辨率到高分辨率的映射,采用這種方法可以獲得縮減規模投射。依賴統計模型的選擇,小尺度投射在準确性和可靠性上提出了不同的要求。氣候系統的時空特征推動了超分辨率圖像處理技術對統計降尺度的适應性。我們提出了 deepsd,一種用于氣候統計降尺度的、廣義的疊加超分辨率 cnn(srcnn)架構。deepsd 增加了具有多尺度輸入通道的 srcnn,能夠最大化統計降尺度的可預測性。比起誤差訂正空間分解法(bias correction spatial disaggregation)以及三個自動統計降尺度方法,我們采用的方法将美國大陸範圍内日降水量氣候降尺度從 1 度(~100 km)降至 1/8 度(~12.5 km)。此外,我們讨論了使用 nasa 地球交換(nex)平台的架構,用于超過 20 個具有多個排放情景的 esm 模型的統計降尺度。

本文作者:奕欣

繼續閱讀