天天看點

帶你讀《企業數字化基石-阿裡巴巴雲計算基礎設施實踐》第三章資料中心能效3.2資料中心伺服器電能使用率(一)

3.2  資料中心伺服器電能使用率

PUE很重要,但是低的 PUE 并不代表資料中心能效高,例如資料中心溫度提升,IT裝置的耗電量(風扇等部件消耗)增加,PUE會降低,但是整個資料中心能效會變得更差 ;是以引入了 SPUE的概念,其關聯因素主要包括 IT裝置的散熱系統、IT裝置的電源系統,以及IT 裝置的機關能力的電力消耗量(每TB 存儲、每 GB 讀寫次數、每 GHz 計算量的電能消耗量)。

3.1.1 伺服器電源的能效

随着伺服器計算能力的提升,高功耗 CPU的使用、GPU應用場景的增加,都加大了伺服器的整機功耗,直接導緻電費支出在資料中心日常費用的占比越來越高。從伺服器的供電設計看,提高 PSU和單闆電源的轉化效率、減少電源的傳輸損耗,将有利于減少伺服器能耗,節省資料中心電費開支。

PSU

PSU(PowerSupplyUnit)的效率目前已經發展到钛金級别,钛金電源在50%負載以下的供電效率比鉑金電源提高   2%,并且低載效率的提高也符合伺服器叢集的應用。

以 400W 的伺服器、800W的 PSU來說,更換成钛金電源後,每台伺服器可以節省 8.8W 的功耗,1年節省 77 度電,10萬台裝置 1 年可以節省 770 萬度電。在 PSU功耗小于 50% 的情況下,钛金 PSU效率提高更多,能夠減少更多的電費開支。

單闆 DCDC電源

伺服器的電源消耗主要在 CPU和記憶體上,CPU供電 VRM主要向動态節能和效率提升的方向發展。

•    動态節能技術:VRD廠商都在應用新的動态節能技術,此技術能夠随着CPU應用功耗的減小,關閉開關電源的相數達到減小損耗的目的。目前在CPU的使用中,在開啟動态節能後,CPU功耗在 150W 以内,電源效率可以明顯提高。

•   VRD效率提升 :VRD技術主要往小體積、高密度、高內建的方向發展。但是受限于矽 MOS的開關損耗,整體的效率無法明顯提高。VRD的效率進一步提高依賴于半導體新技術的突破。就目前來說,600kHz的開關頻率可以達到效率和性能的最優,方案上配合新的 Drmos和低 DCR電感,在整體的 VRD效率上可以達到94% 左右。目前阿裡的雷神項目使用的就是這套方案。

•    VRD 電源的控制方式:逐漸都使用數字電源的方案,增加電源配置的靈活性。

VRD的技術和 Intel的 VRD規範同步實施,目前 VRD規範發展到 VR13,在整體效率設計和節能設計上也達到了新的高度。基于Purley平台的雷神項目就是按照 VR13 規範完成設計的。

伺服器單闆 48V供電

提到單闆供電方案,就不得不提 Google在單闆 48V供電方面的研究和應用。Google的 48V方案主要配合機櫃整體使用,在伺服器單闆上目前主要針對 CPU/記憶體供電采用 48V方案。因為從伺服器耗電分布上,超過 80%的電量消耗在 CPU和記憶體上,這方面的效率提升直接影響到伺服器整機的效率表現。圖 3-11和表 3-2、表 3-3均引用自谷歌開發計算機峰會簡報,即 TheDatacenterasaComputer(作者 :路易斯 • 安德烈 • 巴羅佐、吉米 • 克裡達拉斯、烏爾斯• 霍爾茲勒)。

伺服器在峰值負載時CPU和DRAM記憶體提升消耗的功率超過80%

帶你讀《企業數字化基石-阿裡巴巴雲計算基礎設施實踐》第三章資料中心能效3.2資料中心伺服器電能使用率(一)

首先,PSU改成 48V輸出後,PSU的效率可以提升,對比的資料參考如表 3-2所示。

帶你讀《企業數字化基石-阿裡巴巴雲計算基礎設施實踐》第三章資料中心能效3.2資料中心伺服器電能使用率(一)

其次,綜合了 PSU和單闆電源的效率資料對比(資料計算基于整機 600W 功耗),在使用 48V供電後,整機的電源轉換效率可以提高 1.5%。換算後單機功耗可以減少 11.5W。按照 10 萬台運作 1年,預估可以節省電量 1000 萬度。

表 3-348V整體效率提升

帶你讀《企業數字化基石-阿裡巴巴雲計算基礎設施實踐》第三章資料中心能效3.2資料中心伺服器電能使用率(一)

雖然 48V的應用可以帶來伺服器電源整體效率的提高,但是伺服器的周邊裝置大部分都是 12V供電,比如 PCIe裝置、硬碟(儲存設備)。解決這類問題需要一定的時間,對目前來說,48V的系統應用在 CPU計算節點伺服器上可以得到比較好的效率改善,但是在 GPU和存儲型節點上,48V的系統應用需要綜合 TCO整體考慮。