天天看點

NVIDIA Tesla K80:怪物般的雙芯計算卡

新一屆高性能計算大會召開,中國的“天河二号”勇奪全球超級計算機性能四連冠,各大廠商也都趁機紛紛推出了各自的重磅新品。

先來看NVIDIA的怪物級計算卡:Tesla K80。

Tesla K系列都是基于“開普勒”(Kepler)架構的高性能計算産品,其中采用GK110大核心的已有三款,而今天這款Tesla K80,從各個方面都進行了前所未有的增強。

NVIDIA Tesla K80:怪物般的雙芯計算卡

首先,她的核心是新的GK210。

GK110核心第一次用于高性能計算是Tesla K20,隻開啟了2496個流處理器,經過一次修訂後更新為GK110B,先後推出了2688個流處理器的增強版Tesla K20X、2880個流處理器的完整版Tesla K40,後者還提供了三個檔次的核心頻率。

GK210則是NVIDIA第一次對某個核心進行中途修改,最大的變化就是寄存器檔案、一級緩存容量都翻了一番,分别來到512KB、128KB,不過整體架構沒變,還是2880個流處理器、384-bit位寬,制造技術也依然是台積電28nm,但半導體數量理論上應該比71億個更多了。

寄存器檔案、一級緩存增大後,可以明顯改進流處理器陣列内的資料吞吐能力,工作更高效,尤其适合高性能計算。這顯然是一次針對性的重新設計。

NVIDIA Tesla K80:怪物般的雙芯計算卡

可怕的是,Tesla K80一次就用了倆GK210核心,而上次的雙芯計算卡還是Tesla K10,當時用的是倆小核心GK104。

不過可以了解的是,如此龐大的兩個核心很難全速開動,每一個都隻開啟了15組流處理器陣列中的13組,也就是總共2496×2=4992個流處理器,相當于Tesla K20翻了一番。

核心頻率也定得很低,隻有562MHz,但是第一次支援GPU Boost動态加速了,最高可達875MHz。顯存是兩組384-bit 12GB GDDR5,總計達24GB,但頻率也不是很高,隻有5GHz。

這一切都是出于功耗的妥協。Tesla K20X/K20已經達到235W,而雙芯的Tesla K80在一番折騰後,仍控制在了300W,并且保持了雙插槽的身材,但需要使用被動散熱,由系統風扇帶走熱量,主動散熱版暫時沒有。

性能方面自然可期,官方宣稱FP32單精度、FP64雙精度浮點性能最高分别可達2.91TFlops(萬億次浮點)、8.74TFlops(比例還是1:3),比此前提高了74%,但這隻是最大加速理論性能,實際上會低一些。

1U标準機架内可以放入最多四塊Tesla K80,雙精度性能可超10TFlops。

根據情況不同,Tesla K80的效率提升幅度最好59%,最差2%。

NVIDIA Tesla K80:怪物般的雙芯計算卡

Tesla K80的售價高達5000美元,但其實比單芯Tesla K40 5500美元的首發價格便宜了很多,不過後者現在已經降至3900美元。

目前,全球性能第十的Cray CS-Storm,以及戴爾、惠普、廣達的高性能計算系統都已經配備了Tesla K80。

NVIDIA Tesla K80:怪物般的雙芯計算卡
NVIDIA Tesla K80:怪物般的雙芯計算卡
NVIDIA Tesla K80:怪物般的雙芯計算卡
NVIDIA Tesla K80:怪物般的雙芯計算卡
NVIDIA Tesla K80:怪物般的雙芯計算卡

繼續閱讀