天天看點

AWS Graviton3:遵循摩爾定律又有自己節奏

作者:企業存儲技術

注:本文來自一位專家朋友Winnie shao博士的原創大作,希望大家喜歡。

亞馬遜雲科技的 Graviton 3

1、Graviton3的設計與創新

AWS Graviton3:遵循摩爾定律又有自己節奏

不僅僅是半導體數目,如下圖,從2018年的Graviton第一代,到今年的Graviton 3,可以清楚的看到,一代一次顯著性能的飛躍。

(注:)

AWS Graviton3:遵循摩爾定律又有自己節奏

其實無論是用Chiplet設計,還是采用DDR5、PCIe Gen5、5nm工藝,先進歸先進,但是阿裡平頭哥10月釋出的的倚天710也都有,随後的Intel,AMD也都有,是以算是正常操作。不過Graviton系列的功耗,是顯著低于前面說到的幾個晶片的。以前,我一直沒有想明白這個參數設計,直到看到Amazon C7g的伺服器開蓋圖。這是在一個機箱内放了3個Graviton3,成為一個3節點的高密度伺服器。換句話說,一個機箱内放入3個64核的伺服器節點,如果換算成正常2路CPU,則相當于每個CPU是96核。如果Graviton2是正常的2路伺服器設計,再考慮上主頻的提升100Mhz,那麼Graviton3的伺服器是Graviton 2性能近2倍。這非常符合亞馬遜雲科技的本色,他們追求的是相同總功耗下的整伺服器/整機架的性能最大提升,從晶片設計階段,就通盤考慮過從伺服器節點——到機架整體的合理功耗預算配置設定,而才能确定的設計方案。

最後一定要補上一句, 亞馬遜雲科技能做這樣設計3節點伺服器的另一個原因,是因為他們有能夠支援多服務節點的Nitro卡,否則每個節點都需單獨配網卡,會部分抵消高密度伺服器設計的優勢。

AWS Graviton3:遵循摩爾定律又有自己節奏

2、CPU做機器學習

Amazon Graviton 3的設計中,還有一點要特别畫一個重點。它支援了bfloat16,并且提升了3倍的機器學習性能。Intel的cooper lake、AMD的Zen4、IBM Power10也都支援了bfloat16,而且都3倍、甚至20倍的提升了機器學習的性能。CPU陣營難得一見的齊心合力,打算增強自己的人工智能業務能力。

AWS Graviton3:遵循摩爾定律又有自己節奏

3、與Graviton3同步的C7g執行個體标志着arm伺服器生态成熟

除了Graviton3 在晶片、伺服器上的各種創新之外,還有一點和2019年Graviton2的釋出不一樣。與Graviton3同時釋出的還有一個執行個體Amazon C7g,雖然還是預覽版,但是相對于Graviton2釋出3個月之後才釋出執行個體,AmazonGraviton家族的執行個體研發節奏明顯快了。相對于同行的僅僅晶片,尚無執行個體上線的時間的新聞釋出,Graviton3不僅僅有晶片、有伺服器,還有執行個體預覽,甚至還有客戶的背書,産品成熟度有明顯優勢。

和Graviton3翻倍的浮點性能,3倍的機器學習性能相呼應。Amazon C7g是一個定位于高性能工作負載的執行個體。亞馬遜雲科技推薦的應用,包括高性能計算、批處理、電子設計自動化(EDA)、媒體編碼、科學模組化和基于CPU的機器學習推理。這跟當年Graviton1支援的是 Web 伺服器、容器化微服務、資料/日志處理和其它可以在更小的核心上運作的輕量級工作負載,不可同日而語了。

其實Amazon Graviton2 處理器已經在性能和功能上都實作了巨大的飛躍,成為ARM陣營的領頭羊。它們為 Amazon EC2 通用型(M6g、M6gd、T4g)、計算優化型(C6g、C6gd、C6gn)和記憶體優化型(R6g、R6gd、X2gd)執行個體提供支援,工作負載類型相當廣泛。本次大會上又釋出的AmazonG5g,這是一個Graviton + Nvidia T4G的組合,還有兩個配合最新的NitroSSD的存儲優化執行個體Im4gn and Is4gen。最後要重點提一下,資料庫的标杆産品SAPHANA也支援Graviton家族了,這不僅僅是Graviton家族的成功,更是ARM伺服器生态的一大步。

其實從arm進入伺服器市場開始,對于arm是否能撬動伺服器生态持懷疑态度。從三大Linux,到Java OpenJDK、gcc/LLVM,到Ngnix、MySQL、Redis,arm在開源軟體陣營獲得了很好的支援。但是像SAP HANA這樣的ISV(獨立軟體提供商)的支援,是Graviton家族開拓arm伺服器生态的重要裡程碑事件。

AWS Graviton3:遵循摩爾定律又有自己節奏

不僅僅是生态成熟,執行個體豐富。Graviton3再次提升了實際應用性能。在亞馬遜雲科技展示的F1應用測試中,Graviton3比Graviton2 快40%。對于Nginx,Graviton3有超60%的性能提升,其它應用,也至少有25%的性能提升。

AWS Graviton3:遵循摩爾定律又有自己節奏
AWS Graviton3:遵循摩爾定律又有自己節奏

小結

現在回頭看當年3.5億美金收購Annapurna lab真是回報超高。先是業界領先的Nitro系列,接着是Graviton arm CPU家族,再接着是機器學習兩件套支援推理的inferentia和支援訓練的Trainium。資料中心的三大晶片,DPU、CPU、AIxPU,整整齊齊。

亞馬遜雲科技的CEO在采訪中談到晶片創新的時候說,這是改變遊戲規則的能力。Graviton産品家族驗證了從借助arm CPU IP的靈活晶片設計,到晶片和伺服器聯合設計,到快速部署上雲的網際網路速度。這是一個用創新推動高品質服務的時代。

注:本文隻代表作者個人觀點,與任何組織機構無關,如有錯誤和不足之處歡迎在留言中批評指正。如果您想在這個公衆号上分享自己的技術幹貨,也歡迎聯系我:)

尊重知識,轉載時請保留全文。感謝您的閱讀和支援!

繼續閱讀