天天看點

高性能計算HPC脫去貴族外衣

作者:魏珺

原文:http://www.cioinsight.com.cn/html/article/2009/06/1688.html

  随着科技的不斷進步,過去僅僅是在氣象、地質勘探、空氣動力學等科研領域應用的HPC,現今更趨于“平民化”,高性能計算(HPC)正在3D動畫、生物制藥、汽車設計等商業領域大展拳腳。

  談到高性能計算,最為典型的代表莫過于氣象、地質勘探行業的應用。氣象行業中高性能計算主要應用在數值預報模式中的業務運算研究以及研制開發上。所謂數值預報即根據大氣實際情況,在一定的初值和邊值條件下,通過大型計算機作數值計算,求解描寫天氣演變過程的流體力學和熱力學的方程組,預測未來一定時段的大氣運動狀态和天氣現象的方法。

  根據天氣動力學原理,用十幾個偏微方程組來描述大氣的實體運動狀态。用數值解将空間分成若幹個等距節點,把大氣從水準到垂直切割成立體網格,通過對網格中每個立體方格的氣壓、溫度、濕度、風的尾向、靜止方向以及垂直方向六要素的搜集,用偏微方程進行解析解。“數值預報的計算量很大,可以毫不誇張地說,無論性能再好,運算能力再強的計算機拿過來在氣象行業應用,過不了多久就能讓它負荷滿滿。” 國家氣象局資訊中心副總工沈文海這樣形容道。

  數值預報模式一方面計算複雜性高,另一方面需要計算處理的原始資料量大。首先對于原始計算資料來說,風雲三号極軌衛星一條掃描帶繞地球縱向轉一圈的資料量就有3G左右,極軌衛星每天資料采集量達到100G之多。而風雲一号、二号靜止衛星的資料量每天約有10G。此外雷達預報中,每個雷達每天的資料量都在5G左右,一年的資料增量在100-200TB之間。如此大的資料量都需要借助高性能計算實時分析。

  其次,氣象行業計算複雜性高、計算量大,多年來已成為高性能計算應用的主要使用者。例如:對于氣候的評估,用若幹個模式來評估青藏高原未來五十年至一百年以後的氣候狀況,以了解未來青藏高原的溫度是否升高,凍土層是否會融化。“這些都需要我們對以往所有該地區氣候資料的搜集,進行資料分析,建立模型,并最終作出評估,确實離不開對資料的計算。”沈文海解釋道。

  同樣,甘肅省氣象局面對當地一些區域樹木幹枯、河水斷流的現象進行分析,根據資料的計算發現造成幹旱的根本原因是雪山融水的減少。由于氣候變暖,山上積雪量減少,雪山上的融水減少,造成積水滲透到地下水中量減少,地下水會以某種形式轉變成泉水,再由泉水彙內建河流,由于最終水源積雪融水的減少,使得這些區域變得幹旱。

  “現在對于氣候模式數值預報正在發展中,不同模式每種模式都需要計算,即便同一模式下,由于觀測密度不同計算量也不一樣。”沈文海講道。例如:同一種模式下1度×1度是一種算法,0.5度×0.5度又是一種算法,而且每縮小一倍,計算量增加4倍。這僅僅是水準切割,再加上垂直劃分,計算量以數量級的規模增加。因為對于整個大氣網格劃分越密,監測越細緻,對于某一地區災害性天氣的預測就越準确。

  此外,除了借助高性能計算對氣候做長期跟蹤以外,還對某地區短時間内的天氣進行預測。例如:冰雹這類災害性天氣可以對積雲密度的分析,該地區空氣對流的強度的計算進行預測。

  同樣在科研領域中,南京大學較早将高性能計算機應用在大氣科學、地球科學、生命科學、以及實體、化學領域的研究。“從國内外最近這十多年的發展來看,計算科學在科學研究當中所起的作用越來越大,除了流體動力學在工業領域的應用外,生命科學和材料科學是兩個發展最迅速、應用最廣泛的領域。” 南京大學地球科學與工程學院、江蘇省計算機學會高性能計算專業委員會主任委員周會群教授談到。

  “高性能計算還在改變着一些傳統科學領域的面貌。對于地球科學,過去人們的印像是,拿着榔頭到野外去敲敲石頭,拿顯微鏡看看。而現在我們可以用高性能計算機來分析地球内部的物質結構。” 就高性能計算對科學研究的影響,周會群教授這樣說到。

  同樣在實體化學領域,對于一些功能性的材料添加某種物質後,它的實體性質:力、熱、聲、光、電、磁性質是否發生奇異的改變,這些都可以借助通過計算得出。再比如說生命的奧秘——基因序列的測定,蛋白質自組裝機制的探索,如何能夠最有效地、最節省成本地開發一種新藥?這些都離不開高性能計算機的應用。

  對于能源勘探行業,更是高性能計算應用的傳統行業。“我們通過人工爆破,在地面部置檢波器,當爆炸聲傳到地下後遇到不同物質界面會反射回來,我們通過搜集反射波,并利用高性能計算機對其進行分析,了解地質構造。” 中海油能源股份有限公司采油工程研究院朱曉欣談到。借助高性能計算及處理大量石油勘探資料,對盆地目标造影,了解地下資源分布狀況。

  不管是天氣預報還是能源勘探,對于任何資料的分析都離不開高性能計算,而現今高性能計算正在從這些傳統應用領域走向更廣的商業領域應用中。

  解決 SOLUTION

  目前國家氣象局是國内比較大的計算中心之一,其中在04年引進美國IBM Cluster1600叢集式計算機,峰值處理能力達到21萬億次,持續處理能力在7萬億次,是目前國家氣象局最大的高性能計算機,擁有3000多個CPU,100多個點。

  在數值預報中,高性能計算機最主要的工作就是資料同化。當搜集所有資料後,把資訊标準化,在計算上分為邊界場和初始場,相當于把所有資料放在每個格子裡進行運算。

  “資料來了以後,我們首先把資訊按照某一模式放在格點上,并插到相應的要素(氣壓、溫度、濕度、風的尾向、靜止方向以及垂直方向)上,經過不同模式的計算産生不同的數值預報産品。”沈主任解釋道。

  “但是在國際上,數值預報模式全球共享,而數值同化模式卻是保密的,中國目前與國外氣象預報水準的差異也在這裡。”沈主任補充道。

  實際運算中,由于計算資源有限,一般是嵌套運算。首先計算出國家級全球背景場預報模式,平均每6小時計算一次,時間分布一般是24:00、06:00、12:00、18:00四個時段。高性能計算機一天24小時不停運轉,在每個時段執行不同計算任務。

  各省級氣象預報會在國家氣象局全球背景場模式預報基礎上,根據這些預報資料作為自己計算的初始場和邊界場,進行區域天氣預報計算。同時國家氣象局對于各地區氣象預報擁有終審權利,每晚天氣預報都會先報到國家氣象局經過稽核後再釋出。

  對于特殊天氣的預報,臨近預報模式由各地氣象局自己負責。例如北京氣象局針對奧運期間每小時的精确預報,通過在具體區域對空間尺度更細的劃分進行檢測,并對檢測結果進行計算了解該地區短時間内天氣活動狀況。

  面對不斷增長的高性能計算需求,南京大學計劃在09年7月份建成高性能計算中心。“該計算中心采用IBM刀片處理器,英特爾至強5500系列晶片,理論計算峰值達到35萬億次,實際計算能力估計約為27萬億次。”周教授介紹到。該計算中心是全校共享,通過超高速網絡—InfiniBand,帶寬可以達到每秒20GB,來縮短交換資訊的過程。

  “因為我們做高性能計算的時候,都是把計算任務分布到很多台計算機上,在很多的CPU上進行計算,每一個CPU隻是去負責這個問題其中一小部分,但是這一個小部分跟很多在其他計算機上、在其他的CPU上計算的那些部分互相之間有關聯,是以就需要交換資訊的過程越短越好,加快計算速度。”周教授解釋道。

  “石油勘探開發中主要是地震資料的處理,首先地震資料存儲在錄音帶上通過錄音帶機加載到工作站上,人員對錄音帶機進行初步的分析,對初期資料進行歸納整理然後傳到伺服器上,伺服器進行整體分析運算,最終的處理結果傳回到單機上。”朱曉欣談到。目前中海油能源股份有限公司采油工程研究院高性能計算中心采用叢集式計算機,其中最大的計算機共有96個CPU,并且整合在一個機櫃,支援多線程計算及記憶體共享,根據計算量大小自動調控CPU。

  實際計算中,資料采集上來存儲在錄音帶庫中,經過前期處理後模組化,經過伺服器具體運算,同樣資料經過多次反複計算,最終形成地質剖面圖。除了以上傳統領域應用高性能計算以外,在汽車安全模拟分析,對一些整車正面和側面及乘員安全性分析;疲勞耐久性分析,汽車外流場數值模拟;空調系統CFD分析與優化等方面高性能計算也發揮着重要的作用。同時對于汽車鋼闆的性能進行模拟計算,鋼液流動模拟計算機并行程式開發,以及高爐結構性能全三維分析等等。

  此外大家熟知的3D動畫中也有高性能計算的身影。比如說渲染農場的應用,渲染農場是一個計算機群,用于渲染這種CGI的圖像,主要用于電影或者電視廣告當中一些現實場景無法拍攝,隻能通過虛拟或者仿真的方式,達到一個影視的特效結果。

  在這裡是一個計算量随着視訊的分辨率還有它的變化的趨勢圖。最低是标準清晰度的視訊,我們日常看到的電視的标清的分辨率的圖檔,一個15秒的廣告,一台主流的兩路雙核的伺服器,就需要31小時進行渲染。若是高清視訊,或者電影要求的畫面品質,在影院放映的高分辨率視訊的話,一部1.5小時的電影一台伺服器需要7500天才能渲染完畢。由此可見計算量是非常大的。

  挑戰 CHALLENGE

  高性能計算在在随着性能不斷提升的同時,其能耗問題日益受到關注。此前國家氣象局一台IBM Cluster1600每天的電費就在8萬元人民币左右,一年下來僅電費就要花費1000多萬元。

  在保證性能的同時,南京大學建立的高性能計算中心充分考慮到能耗問題,從最初機房設計開始建構一個綠色高性能計算中心。“傳統的IDC的中伺服器前面吸進冷空氣後面排除熱氣,冷熱空氣沒有間隔,混合在一起通過通風系統抽走。對于CPU使用率很低的一般企業資料中心來說,這樣的設計并無大礙,但是對于高性能計算中心來說,一旦計算任務上去,CPU均為滿負荷,發熱量劇增,能耗驚人。”周教授強調到。

  南京大學從最初設計就分成冷熱走道,冷熱空氣不混合,通過機房實體設計減少溫控的能耗。“一般我們的機房空調溫度都在18度左右,我參觀過日本東京工業大學的高性能計算中心,那裡空調溫度居然在27度。對于大規模的資料中心來說,溫度降低一度都能節省大量能源。”周教授談到。

  如果說南京大學面臨的是能耗問題,那麼對于國家氣象局來說計算資源的緊缺是一個長期困擾的問題。“歐洲氣象中心天氣預報模式全球公認最好,在那裡業務運算中的70%計算資源用于同化資料處理,30%用于數值預報,而我們正好相反。他們平常的計算資源60%以上用于科研,隻有40%用于具體業務運算,而我們對于僅有的計算資源首先保證業務運算其次才是科研運算。”沈文海談到。

  由于計算資源的緊張,嚴重制約了中國氣象行業的發展。由于氣象行業體制的問題,對項目審批管理方式的問題,造成重視購買計算裝置忽視購買計算資源。傳統觀念認為計算資源是一個無形産品,不認同購買計算資源的形式。

  同時由于高性能計算硬體發展速度較快,反而軟體的速度遠遠落後于硬體速度,又由于軟體設計本身的好壞直接影響硬體計算能力,使得石油勘探行業中過于依賴國外軟體,缺少自己軟體開發能力。造成硬體計算資源由于軟體的阻礙而不能發揮出應有的計算能力,一定程度上造成計算資源的浪費。

繼續閱讀