天天看點

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

2018年新年伊始,1月3日,北京白天最高氣溫驟降至冰點。然而天氣的寒冷,并未阻擋未名湖畔北京大學英傑交流中心裡面熱烈的氣氛——在這裡,采用了聯想首創45℃溫水水冷技術的北京大學高性能計算校級公共平台“未名一号”正式揭牌啟用,标志着我國第一套大規模溫水水冷高性能計算平台落地運作。

值得一提的是,啟動儀式前,北京大學校長林建華與聯想集團董事長兼CEO楊元慶,聯想集團進階副總裁、資料中心業務集團中國區總裁童夫堯等舉行了會晤。雙方就未來AI發展趨勢、打造世界一流學科,吸引優秀科學家、培養适應未來發展需求的新型人才等話題進行了深入交流。

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

北京大學校長林建華(左三)與聯想集團董事長兼CEO楊元慶(右三),聯想集團進階副總裁、資料中心業務集團中國區總裁童夫堯(右二)會晤

為什麼一個校級公共平台的啟用獲得了雙方上司的如此重視?又為何把啟動儀式放在新年伊始?聯想溫水水冷高性能計算平台在國内的落地帶給了業界哪些啟發和意義?是本文要嘗試解答的三個話題。

支撐科學創新

衆所周知,如今全球已經開始進入人工智能和大資料時代。各行各業,包括科學計算在内的各個學科,都對大規模資料處理的需求大幅度提升,是以計算力的提升成為高校學術創新、提升整體科研實力的關鍵環節。

北京大學副校長兼教務長高松院士表示,“北京大學正處于建立世界一流大學程序的關鍵時期,高性能計算平台既可以幫助北大在學科建設、人才培養和科研攻關等方面保持優勢,又可以鼓勵和帶動學科交叉融合,支援重大科研項目。這一平台的建成和啟用将為北大高水準科學研究、前沿科技探索和創新型人才培養提供良好支撐和保障。”

很顯然,平台不僅會有助于相關領域專家、學者開展最新研究,也是北大科研創新、紮實推進國家重大基礎設施項目建設的重要保障。據北京大學實體學院副教授、北京大學高性能計算校級公共平台主任雷奕安透露,“未名一号”在試運作期間,已經支撐了北京大學21個院系的100多個科研項目,甚至支援發表了高水準的論文,得到了各方的肯定。

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

北京大學實體學院副教授、高性能計算校級公共平台主任雷奕安

“試運作期間,我們把‘未名一号’的相關節點使用率、PUE值、功耗的系統運作狀況公布在網上,北京市的很多大學都知道了我們的‘未名一号’的各項名額都非常突出,是以很多學校都希望提前參觀看一下,借鑒我們的做法建設自己的高性能計算環境。因為高性能計算對社會、對科學越來越重要。”雷奕安表示。

很明顯,超算在科研中的重要性越來越顯著。而“未名一号”則在我國高校合理建設超高性能計算平台、降低能耗方面起到了明顯的示範作用,是以受到各方的廣泛關注就不足為怪了。

正式運作提前

實際上,早在多年前,北京大學就有了建設高性能計算校級公共平台的。

雷奕安介紹說,那時候,北京大學各個院系都有自己的計算中心,甚至很多研究組都自己購買計算機叢集,分散了精力和計算資源,無論是電力資源、辦公室資源、人力資源等等,都是很大的浪費;另一方面,此前一些大型計算需求的項目會租用國家計算中心,但租用國家計算中心,仍然在軟體、存儲等方面出現各種問題。

是以學校下決心建設校級超算中心,在上面預裝好幾十個學科常用的應用軟體,不僅緩解各個學科領域對于大規模資料處理和科學計算的海量需求,還友善學校研究人員采用更多新的手段和研究方式,來助力北大推動産學研用的一體化協同發展。

顯而易見,自建校級超算平台的好處很多。也正因為此,從試運作開始,“未名一号”就得到了各個院系的青睐,三個月平均使用率高達97%!在這樣的情況下,原計劃下個學期正式運作的“未名一号”不得不趕在2018年新年伊始提前進入正式運作狀态。

“一是因為‘未名一号’試運作的三個月非常穩定,二是因為平台使用率太高,目前已經支撐了100多個科研項目,開了300多個賬号,還有太多項目在排隊,是以我們提前進入正式運作階段。”雷奕安解釋說。

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

據悉,未名一号總共由227個節點組成,其中計算節點196個、GPU節點10個、KNL節點8個、胖節點3個、管理和登入節點6個、IO節點4個,存儲采用聯想GSS24存儲系統,容量2784.8TB,計算網絡采用Omni-path架構,編譯器采用GNU和Intel最新編譯器套件,作業管理采用Slurm作業排程系統,叢集管理采用聯想LiCO叢集監控管理套件。該叢集系統理論計算峰值高達411萬億次/秒,計算節點理論峰值261萬億次/秒,實測計算能力達到242萬億次/秒。

水冷節能是趨勢

實際上,北京大學高性能計算校級公共平台的建設最終花落聯想,除了運作高效、穩定之外,另一個重要因素就是節能環保和智能管理。

“我們的優勢在于以使用者為中心提供服務,不僅可以提供一個穩定、持續、高成本效益的整體方案,而且還通過溫水水冷、LiCO智能機房管理軟體,來幫助使用者降本增效。”聯想資料中心業務集團中國區副總裁李國慶解釋說。

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

聯想資料中心業務集團中國區副總裁李國慶

據悉,聯想的高性能計算方案可以做到整機傳遞、拎包入住,在客戶拿到裝置的時候基本上已經調優好了,機器處于随時可以工作的狀态。

“聯想有一套非常嚴格苛刻的傳遞流程。專家必須完成三次實施後才允許自己獨立實施,是以這一項目請到了聯想在美國的三位專家飛過來實施、測試,確定品質。”聯想資料中心業務集團中國區企業級營銷産品營銷總監李炜表示,“正因為聯想具備整機傳遞的能力,是以裝置到達北大超算中心到實施傳遞完成,僅僅用了一個月的時間就完成了。”

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

聯想資料中心業務集團中國區企業級營銷産品營銷總監李炜

實際上,“未名一号”由于體系架構全、帶寬大,是以能夠完成的項目非常多,乃至于北大各個院系都争相應用。與此同時,基于聯想深騰X8800的“未名一号”采用45℃溫水水冷技術,不僅使 LINPACK效率達到92.6%,PUE值控制達1.1,可以更節能,而且由于水的熱容要比空氣大800多倍,是以整個系統的溫度更加穩定,對于CPU、記憶體的穩定運作和使用壽命都有很大好處,同時也就保證了超算并行計算節點的穩定可靠。

“未名一号節省了50%的制冷散熱成本,每年将為北京大學節省60萬度電。”雷奕安表示。

滿足各界高性能計算需求

據悉,作為資料中心機房水冷解決方案的積極推動者,聯想已經與國内外多所高校展開合作。在國内,聯想與南京大學、廈門大學等院校合作建立超算平台,持續提供強大計算力支援。在與南京大學的合作中,聯想為其傳遞了近九百萬億次超算叢集,創造了國内大學高性能計算平台規模最大的紀錄。在全球範圍内,聯想赢得牛津大學、倫敦大學、芝加哥大學、北卡羅萊納州立大學等高校的信賴。比如,聯想與北卡羅萊納州立大學研究人員正在開展更深入的研究,以應對全球糧食水源短缺的挑戰。在倫敦大學學院,研究人員正在通過大型強子對撞機,重建高能粒子碰撞事件,解決有關宇宙起源的基本問題。

除此之外,聯想的HPC也已經廣泛應用于政府、科研、教育、氣象、大氣海洋、石油石化、CAE仿真計算、生命科學、人工智能等各個領域。

溫水水冷超算平台落地北大,聯想賦能行業智能化變革

由左至右依次為北京大學副校長兼教務長高松院士,北京大學黨委副書記兼秘書長安钰峰,聯想集團進階副總裁、資料中心業務集團中國區總裁童夫堯,聯想資料中心業務集團中國區副總裁李國慶

目前,全球最大的7個資料中心中,有6個采用了聯想的解決方案和服務;聯想還連續第四次取得HPC TOP 500榜單中國第一,全球第二的成績,并以17%的增長率成為全球增速最快的HPC廠商。目前全球500強企業超算系統中,有92家采用了聯想的HPC。所有這些都表明,聯想高性能計算的應用領域非常廣泛。

“過去數年高速發展的智能化走得越來越快,離我們越來越近。其中計算力,也就是超算叢集所發揮作用的地方,是智能的引擎。”在楊元慶看來,聯想追求的不僅僅是快,同時非常重視節能環保、重視智能化的研發,為人們工作生活帶來便利,為社會發展的可持續性帶來有益的經驗。

繼續閱讀