天天看點

中國高校最大雲上科研智算平台上線,由複旦大學與阿裡雲共建

作者:澎湃新聞

·首個基于CFFF平台訓練的科學大模型,是複旦大學人工智能創新與産業研究院李昊團隊研發的45億參數量的中短期天氣預報大模型,目前訓練成果已正式釋出,并達到國際先進水準。在CFFF平台上,45億參數量一天之内就能訓練完畢。

中國高校最大雲上科研智算平台上線,由複旦大學與阿裡雲共建

部署在複旦校内的“近思”一号和托管在1500公裡外阿裡雲烏蘭察布資料中心的“切問”一号連成了一台真正意義上的“超級計算機”。

6月27日,中國高校最大的雲上科研智算平台CFFF(Computing for the Future at Fudan)在複旦大學正式上線。

澎湃科技(www.thepaper.cn)了解到,CFFF是為發現和解決複雜科學問題而建設的科研“超級計算機”,由面向多學科融合創新的AI for Science(人工智能用于科研)智能計算叢集“切問”一号和面向高精尖研究的專用高性能計算叢集“近思”一号兩部分組成,二者的名稱來源于複旦大學校訓“博學而笃志,切問而近思”。據介紹,CFFF由複旦大學與阿裡雲、中國電信共同打造,以先進的公共雲模式提供超千卡并行智能計算,并支援千億參數的大模型訓練,這在國内高校中屬于首例。

平台啟動儀式上,中國工程院院士、阿裡雲創始人王堅回憶起2008年剛創辦阿裡雲時在高校的演講,他表示,自己最初投身雲計算的初心,就是“讓每一位學生都能用得起超算,讓計算發揮出它的價值。”15年後CFFF平台上線,讓王堅感慨自己當年的願望成真。

複旦大學校長、中國科學院院士金力表示,一方面,CFFF作為國内高校第一的大規模異構智算平台,希望它能夠為複旦的基礎科學研究提供更強大更穩定、更加靈活高效低成本的算力支援。另一方面,希望基于CFFF平台能夠建成一批具有世界級影響力的科學大模型,例如生命科學大模型、大氣科學大模型、材料科學大模型、內建電路大模型等。

45億參數量一天内訓練完畢

目前,CFFF平台上的第一個科研成果已經誕生,是複旦大學人工智能創新與産業研究院李昊團隊近期釋出了45億參數量的中短期天氣預報大模型,預測效果在公開資料集上首次達到業界公認的ECMWF(歐洲中期天氣預報中心)集合平均水準,并将預測速度從原來的小時級縮短到了3秒内。據介紹,這個45億參數量的大模型隻用一天就完成了訓練。

李昊在接受澎湃科技等媒體的采訪時介紹,“第一,我們把它的預報時長延長到了15天;第二,我們做到了歐洲的中期天氣預報中心的集合平均水準;第三,模型采用的相對數值模式的推理速度是分鐘級甚至秒級,這也是這個人工智能模型本身的優勢。”

“基于CFFF平台的千卡并行智能計算,這樣一個規模的大模型隻用一天就完成了訓練。傳統的計算平台是很難做到的。”李昊說。

不過李昊也表示,目前大模型取得的成績更多還是統計意義上的結果,天氣預報是一個複雜的過程,對于台風等極端天氣的預報還需要在更多實際場景中去驗證模型,也需要跟産業界更多機關和專家進行合作。

金力表示,未來CFFF平台還将持續擴大其算力規模,并向複旦校外的科研機構、高校、醫院、高科技企業等開放。

金力認為,在資料和智能技術驅動的“大科學時代”,如何在日新月異的科技創新環境中赢得主動,在關鍵領域取得創新突破,是時代給予高校的命題。以CFFF平台為代表的智算平台作為一種新興的科研超算架構,将成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學原理發現和技術突破,并有力推動科學大模型的落地。

據複旦大學介紹,CFFF平台從開始建設的第一天起,就收到了來自複旦不同院系的多種研究需求,不僅涵蓋生命科學、大氣科學、材料科學領域,也包括金融系統分析等社會科學研究。平台上的雲原生與低代碼工程化AI開發平台,進一步降低了AI與科研融合的門檻。

27日,面向全球科研人員的首屆“世界科學智能大賽”也宣布正式啟動,大賽設定生命科學、量子化學等五大賽道,CFFF平台将為參賽隊伍提供免費訓練算力,并以更普惠的算力長期支援部分科研項目。

複旦四校區所有實驗裝置都能高速接入

在具體技術層面,部署在複旦校内的“近思”一号和托管在1500公裡外阿裡雲烏蘭察布資料中心的“切問”一号連成了一台真正意義上的“超級計算機”。百G高速資料傳輸網和阿裡雲的大規模異構算力融合排程技術、分級存儲技術、AI與大資料一體化技術,讓複旦四校區的所有實驗裝置都能高速接入,做到異構算力統一管理,計算任務統一排程,滿足不同應用場景下的科學智能研究與應用需求。位于“東數西算”節點上的阿裡雲烏蘭察布資料中心,以公共雲模式為複旦校内多學院的多個科研項目提供更高性能、更具彈性、更低成本和更綠色的智能計算服務。

複旦大學浩清教授、人工智能創新與産業研究院院長漆遠表示,有賴于公共雲模式,跑在CFFF平台上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。

另外,據複旦大學方面介紹,CFFF平台還擁有國内高校最大規模的多級資料冷熱分層存儲叢集,解決了海量科研資料無法長期備份的痛點,并支援雲上高速傳輸。以往PB級科研資料從複旦校内傳到西部資料中心需要兩周,如今當天就能完成,真正實作了“東數西算”。

高校與企業如何合作?

啟動儀式之後,金力和王堅一道接受了媒體采訪。談到此次阿裡雲與複旦大學的合作,王堅和金力均表示,企業與高校的合作不應僅僅局限于産學研科技成果轉化的範疇,而應将其看作企業與高校聯合創新并聯合培養人才的活動。

王堅表示,高校和企業的合作不僅是高校把研究成果轉化到企業這樣一個簡單的關系,而是可以創造出更多東西。回溯曆史,IBM和哥倫比亞大學的合作誕生了計算機專業,MIT和貝爾實驗室的合作誕生了通訊專業,而此次阿裡雲與複旦大學的合作也可以在未來創造更多新的機會。王堅還提到,用GPU(圖形處理器)來做AI計算的方法是高校老師和學生首先使用的,但産業界後來将這種方法做成了規模化,這讓高校和産業界在創新上有了更好的關聯。

金力表示,科技飛速發展為高校如何培養學生造成了很大挑戰,一方面是跨學科的融合,另一方面是新技術不斷地産生,為此産教融合非常重要,“這種産教融合不是一個單純的技術轉移的格局,而是創新上和人才培養上高校和企業密切的互動。創新不是簡單地為企業解決一個技術,而是能在國際競争當中處于優勢地位,在人才培養上企業能更多看到社會的進步,是以也能讓高校的人才培養看到目标和方向。”

金力還從複旦大學的角度對新一代工程師的培養提出了新的觀點,他表示:“中國發展到現在,培養工程師除了量的角度,還有一個質的角度,也就是我們不僅要培養更多的工程師,還要培養卓越的工程師。”

“很多人覺得複旦大學文科好,後來發現我們理科也不錯,但是複旦大學的工科沒有形成優勢。”金力坦言,“原來傳統的工科更多強調用成熟的技術和材料去做工程上的實作,總是強調高端、前端,但從産業角度來說這些東西是沒用的。現在我們強調把原創的東西去做工程化的實作,希望把沒用的東西變成有用,這就是傳統工科和新工科的差別。”

繼續閱讀