天天看點

中國高校最大雲上科研智算平台上線,複旦大學與阿裡雲等共同打造

作者:盧松松

6月27日,國内高校最大的雲上科研智算平台CFFF(Computing for the Future at Fudan)在複旦大學正式上線。這台為發現和解決複雜科學問題而建的科研“超級計算機”由複旦大學與阿裡雲、中國電信共同打造,以先進的公共雲模式提供超千卡并行智能計算,支援千億參數的大模型訓練——這在國内高校中尚屬首例,也領先于斯坦福大學等國際知名高校。

目前,首個基于CFFF平台訓練的科學大模型成果已正式釋出,45億參數大模型一天訓完。

複旦大學校長、中國科學院院士金力表示,在資料和智能技術驅動的“大科學時代”,如何在日新月異的科技創新環境中赢得主動,在關鍵領域取得創新突破,是時代給予高校的命題。以CFFF平台為代表的智算平台作為一種新興的科研超算架構,将成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學原理發現和技術突破,并有力推動科學大模型的落地。

中國高校最大雲上科研智算平台上線,複旦大學與阿裡雲等共同打造

雲上傳、雲上算,真正用好科研算力資源

延續複旦大學“博學而笃志,切問而近思”的校訓,CFFF平台由面向多學科融合創新的AI for Science智能計算叢集“切問”一号和面向高精尖研究的專用高性能計算叢集“近思”一号兩部分組成。

複旦大學浩清教授、人工智能創新與産業研究院院長漆遠介紹,基于百G高速資料傳輸網和阿裡雲全球領先的大規模異構算力融合排程技術、分級存儲技術、AI與大資料一體化技術,部署在複旦校内的“近思”一号和托管在1500公裡外阿裡雲烏蘭察布資料中心的“切問”一号連成了一台真正意義上的“超級計算機”,複旦四校區的所有實驗裝置都能高速接入,做到異構算力統一管理,計算任務統一排程,滿足不同應用場景下的科學智能研究與應用需求。

它還擁有國内高校最大規模的多級資料冷熱分層存儲叢集,解決了海量科研資料無法長期備份的痛點,并支援雲上高速傳輸。以往PB級科研資料從複旦校内傳到西部資料中心需要兩周,如今當天就能完成,真正實作了“東數西算”。

位于“東數西算”節點上的阿裡雲烏蘭察布資料中心,以公共雲模式為複旦校内多學院的多個科研項目提供更高性能、更具彈性、更低成本和更綠色的智能計算服務。漆遠表示,有賴于公共雲模式,跑在CFFF平台上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。

中國高校最大雲上科研智算平台上線,複旦大學與阿裡雲等共同打造

同時,CFFF平台更加低碳。阿裡雲綠色資料中心技術結合烏蘭察布當地天然的氣候優勢,CFFF平台可實作年平均PUE小于1.2,每年節省總電力超過2000兆瓦時,年均節碳量達1500噸。

45億參數大模型一天訓完,更多科學大模型有望落地

據悉,CFFF平台從開始建設的第一天起,就收到了來自複旦不同院系的多種研究需求,不僅涵蓋生命科學、大氣科學、材料科學領域,也包括金融系統分析等社會科學研究。平台上的雲原生與低代碼工程化AI開發平台,進一步降低了AI與科研融合的門檻。

鑽研介孔材料多年、曾獲國家自然科學一等獎的趙東元院士對平台推進AI for Science研究充滿期待:“CFFF平台的上線就像我們擁有了一個‘大科學裝置’,讓做科研如虎添翼。實驗科學的資料非常多,如果可以通過文獻資料找到設計一種材料的最佳路線,将會省掉很多時間,我們對物質的認識也會更加深入。”

目前,CFFF平台上的第一個科研成果已經誕生。複旦大學人工智能創新與産業研究院李昊團隊近期釋出了45億參數量的中短期天氣預報大模型,預測效果在公開資料集上首次達到業界公認的ECMWF(歐洲中期天氣預報中心)集合平均水準,并将預測速度從原來的小時級縮短到了3秒内。

“基于CFFF平台的千卡并行智能計算,這樣一個規模的大模型隻用一天就完成了訓練。傳統的計算平台是很難做到的。”李昊說。

中國高校最大雲上科研智算平台上線,複旦大學與阿裡雲等共同打造

這也是CFFF平台上孕育出的第一個大模型。金力表示,複旦希望基于CFFF平台建成一批具有世界級影響力的科學大模型,例如生命科學大模型、材料科學大模型、大氣科學大模型、內建電路大模型等。

未來,CFFF平台還将持續擴大其算力規模,并向複旦校外的科研機構、高校、醫院、高科技企業等開放。當天,面向全球科研人員的首屆世界科學智能大賽也宣布正式啟動,大賽設定生命科學、量子化學等五大賽道,CFFF平台将為參賽隊伍提供免費訓練算力,并以更普惠的算力長期支援部分科研項目。

繼續閱讀