天天看點

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

在語音識别、圖檔搜尋和資料處理等功能遍布于個人裝置,将人們從繁瑣、機械的工作中解放出來的同時,在科學領域,AI正在蓄力等待一個深入滲透進生物、化學、實體、工程等基礎科學領域的契機。

AI被人們賦予厚望,重塑科學研究範式與科研協同方式,并以前所未有的方式推動人類認知邊界的拓展。是以,AI+Science 成為當下探索科技創新、尋找前沿驅動的新思潮。

10月19日,在2021雲栖大會首日上午的主論壇上,深勢科技創始人及首席科學家張林峰發表了以“‘AI+Science’:從科學願景走向大規模工程化”為題的的主題演講,系統性地介紹了“AI+Science”從科學研究的範式轉變到對應場景的具體落地的發展曆程與實作路徑。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

01 AI+Science

連接配接不同實體尺度的橋與門

AI和Science,都是非常熱的詞。做AI的人們在過去的幾年裡完成了CV、征服了NLP,并雄心勃勃地思考哪裡是下一個戰場;而在基礎學科做Science的研究者們,堅持恪守着自己的詩和遠方,卻時常受到于研究手段的限制,難以展開創造和想象力的釋放。當這兩者相融合,将會碰撞出怎樣的火花?

長期以來,我們認識世界和解決問題的思路遵循着兩大範式——開普勒範式和牛頓範式。前者從資料中提取規律,後者尋求基本原理。AI的現有應用場景在兩種範式中也有對應:在CV、NLP等領域的應用是集前者之大成,而當代仿真模拟和工業設計軟體則是後者的精華沉澱。

兩種範式因其自身特點而各受限制,開普勒範式下的模型存在可解釋性、可遷移性不高的問題;而牛頓範式下的模型則要求棘手又漫長的計算過程,即所謂“次元災難”。

在精确程度和計算速度兩難全的困局下,AI+Science 帶來了兩種範式結合的可能性。

AI+Science 意味着AI的複雜資料處理能力和Science的第一性原理的結合,本質上,是兩種傳統研究範式的結合。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

從微觀到宏觀不同尺度的不同實體模型,對應科學研究關注的不同問題。薛定谔方程精準地描述了電子、原子的運動,由此延展,世間萬物的全部奧秘都可以從微觀的層面探尋解答。

AI賦予人們的,恰恰是高維複雜函數的表示能力。我們可以運用AI求解不同尺度上的有效理論對應的實體方程,實體模型的演繹能力又能為我們産生更多資料,用微觀的求解去訓練更宏觀的模型,層層遞進,最終獲得兼具微觀尺度的精度和宏觀尺度的效率。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

用AI連接配接各尺度實體模型

 AI+Science 的系統性機會由此産生,通過AI連接配接起不同尺度,把第一性原理的精度不斷推向宏觀世界,打開通向全新的科學研究範式和落地應用場景之門。

以AI和分子動力學模型結合的 DeePMD(Deep Potential Molecular Dynamics)為例,在Deep Potential方法有效學習了通過量子力學求解得到的原子模型後,可以極大地加速整個體系的模拟速度,實作對數億原子體系的模拟。通過Deep potential工具,一項在超級計算機上需要2億核時的計算,可以在個人筆記本電腦上在一小時内完成複現。這項目工作在去年獲得了高性能領域的最高獎戈登·貝爾獎(ACM Gordon Bell Prize)。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

Deep Potential相關工作獲得2020戈登·貝爾獎

基于DeePMD開源軟體,來自世界各地的數千個材料、化學、生物等領域的研究組正在拓寬着他們的科研邊界,也産生了很多優質的科研成果。這僅是 AI+Science 在微觀領域中的一次實踐,實際上的應用場景遠不止于此,從微觀的化工、材料、藥物到宏觀的飛機、汽車、火箭,都将有AI+Science豐富而廣闊的應用機會。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

AI+Science廣闊的應用場景

02 AI+Science

大規模工程化正當時

在擁有高速發展的算力、精進疊代的算法之後,AI+Science 的大規模深入應用,面臨着一個系統工程化的需求。可以從三個次元了解。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

首先是規模工程,便捷的雲服務已經逐漸成為了基礎設施,過去規模化的雲服務主要面向購物、峰值支付等普通生活需求,中間架構更多是微服務的架構。而科學計算對它有巨大的需求,同時有着大規模并行、大規模并發離線計算以及多種計算資源混用調用等一系列新特點,這些新特點需要有好的架構支援和優秀的中間排程工具,規模工程要更加面向計算本身。

第二是資料工程,在很多AI應用領域,我們從最開始的基本資料積累逐漸到大資料、衍生出的大模型,然後基于這些 Pretrain 模型進行優化、壓縮、做遷移等等。而 AI+Science 也可以做現在很火的大模型,玩模型遷移、模型壓縮等,但它将需要面向實體,尊重實體限制。

最後是性能工程。過去也有不同尺度上的實體模型計算軟體,發展至今經曆了一系列的适配和優化的工作,改進的僅僅是面向不同類型硬體平台做出的定制化優化。而 AI+Science 召喚的是根據不同的計算類型去生産定制化硬體,科學計算的種種基礎設施在當下或許已顯老舊,積累了幾十年,可能已經沒有人願意去清理、疊代了,而這個時候我們需要把它重新的翻個底朝天,因為未來的性能工程将不再是軟體對硬體的适配,而會是硬體對算法的定制。未來的 AI+Science 性能工程,将會是面向算法的!

重構基礎設施的工作需要系統化努力,是以, AI+Science 工程化需要的是科學家、工程師以及各行各業的協同作戰。

是以,我們發起了Deep Modeling 開源社群,希望能夠協同不同領域的科學家、工程師以及各行各業的使用者,以平等開放的交流方式和同行評審的協作機制,重構知識體系和協同方式,共同打造 AI+Science 的新一代的基礎設施。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

經由DeepModeling,從算力封裝到行業應用

在我們所推動的 DeepModeling 開源社群之上,新一代的 AI+Science 大廈正在被建立:底層算力排程、各尺度實體引擎、資料庫、面向各類計算需求的工作流等等,系統性地實作不同領域對計算的需求。

03 AI+Science

栖于雲上的未來願景

那麼AI+Science的未來是什麼?

我的答案是解放科學研究與工業設計的生産力。在 AI+Science 的願景之中,科學家們将有更好的研究工具去探索、聚焦他們關注的問題;面向不同場景的需求,我們會有更好的工業設計的工具。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

深勢科技微尺度工業設計平台體系

基于 AI+Science 的全新研究範式,我所在的深勢科技正聚焦微觀的尺度,計劃在未來5年打造微尺度工業設計平台,希望科學計算的平台能解放科學家、解放科技生産力,更希望我們的藥物設計和材料設計的平台能夠切實賦能于這兩個大的行業。

最後,作為一個科學家,我也希望回歸詩和遠方。引用荷爾德林的一句詩來結束:“充滿勞績,但人類詩意地栖居在這片土地上。”同時我相信,充滿挑戰,但AI+Science終将原生地栖居在這片雲上。

于雲栖處,探索 AI+Science 的大規模工程化01 AI+Science連接配接不同實體尺度的橋與門02 AI+Science大規模工程化正當時03 AI+Science栖于雲上的未來願景

期待我們共同的努力,謝謝大家!

繼續閱讀