天天看點

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

作者:雲體驗師

2023年5月下旬,Ampere正式釋出AmpereOne系列處理器,單顆處理器支援最高192個實體核心,遠遠超過目前AMD最多96核心的EPYC和英特爾60核的至強處理器。

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

與之前的Ampere Altra和Ampere Altra Max一樣,AmpereOne也是單實體核單線程的設計,這樣設計的好處是可以避免雙線程之間,互相争搶資源造成的性能抖動。

由于延續了這一思路,使得它與之前的Ampere Altra系列一樣,也可以提供可預測的高性能,提供較強的彈性和可擴充性,具備高能效和可持續性優勢。

AmpereOne的基本參數資訊

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

AmpereOne出現以前,Ampere Altra系列最多128核心,新的AmpereOne則是從136核起步,最多192核心。是以,AmpereOne可以看做是Ampere Altra的補充,兩者将長期共存。

Ampere Computing首席産品官Jeff Wittich表示,當使用者需要在邊緣計算場景部署時,可以選擇32核、功耗40瓦的Ampere Altra處理器,對于算力需求更大的資料中心使用者,可以選擇核數更多,性能更好的處理器。

Ampere Altra系列采用的是7nm,而AmpereOne系列采用的是台積電5nm。核心方面,Ampere強調核心是自研的,由Ampere自有IP全新打造(Arm ISA沒變,是以不存在相容性問題),這使得Ampere可以根據需求做更多改動。

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

AmpereOne的部分參數規格(L2 Cache翻倍)

能看到,AmpereOne的核心規格有明顯變化,每個核心專有L2緩存從原來的1MB提升到了2MB,對性能提升應該很有幫助。但L1的指令緩存從原來的64KB,縮小為16KB。

功耗方面,Ampere Altra的TDP為40-180瓦,而AmpereOne則是200-350瓦。算下來,每個核心的平均TDP相較于之前有所增長。

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

AmpereAltra的部分參數規格

AmpereOne支援PCIe Gen5和DDR5記憶體。PCIe通道數還是128個,記憶體通道依然是8通道。DDR5最大容量翻倍,而AmpereOne支援的最大記憶體容量也從4TB提升到了8TB。

此外,Ampere Altra的最高主頻為3G,AmpereOne也完全保持一緻。較低的主頻,帶來較低的工作電壓和較低的功耗,還能讓核心持續穩定在固定頻率上,進而帶來穩定的性能表現。

以更少的功耗輸出更多性能

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

AmpereOne跟隔壁x86處理器完全不一樣套路,單機架可提供的性能遠高于x86處理器。同時,在節省能耗和節省占地空間方面也有非常大的優勢。

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

Ampere将能效比優勢視為一大亮點。有調研資料顯示,資料中心貢獻了3%以上的碳排放量,是不折不扣的排放大戶,從節能減排的角度講,AmpereOne非常有優勢。

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

Ampere還提到了全球多地能源價格飛漲的現狀,這些也都會直接影響資料中心的營運成本,對于這些地區的資料中心營運者來說,能效比占優的Ampere非常具有吸引力。

新增BF16計算精度,提高AI推理能力

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

Ampere還提到了AmpereOne在AI推理方面的優勢,這得益于在FP16,Int16,Int8基礎上新增的對BF16的支援。

在運作文生圖的模型Stable Diffusion時,AmpereOne每秒生成的圖檔幀率是AMD EPYC 9654的2.3倍。

在運作智能推薦模型DLRM(Deep Learning Recommendation Model)時,AmpereOne每秒能處理的推薦次數是AMD EPYC 9654的2倍以上。

Jeff Wittich表示,AmpereOne系列處理器設計過程中考慮到了AI的需求。

軟體層面,Ampere收購了AI軟體公司OnSpecta,進而讓Ampere處理器更好地運作AI相關負載。硬體層面,AmpereOne系列處理器新增了對于BF16計算精度的支援。

據了解,目前已經有許多企業都在使用Ampere Altra系列處理器做AI推理,用着Ampere官方Library庫,包括TensorFlow、PyTorch、ONNX等主流架構。

更适合雲計算場景的處理器

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

Ampere一直喜歡強調自家做的叫雲原生處理器,意在凸顯它非常适合用在公有雲的場景。然而,最能展現它适合雲場景就是對虛拟機的支援。

如上圖所示,由于核心比較多,單個Rack能支援更多的虛拟機,更多的虛拟機可以賣給更多的使用者,能幫雲廠商産生更多經濟效益。

為了用如此之多的核心穩定地支援更多使用者,Ampere在記憶體管理上做了很多優化。

在面對記憶體牆和可能存在的記憶體不均衡問題時,Jeff Wittich表示,AmpereOne擁有更高的記憶體帶寬,更好的帶寬管理技術,新的Chiplet技術,新的網格擁塞管理(Mesh Congestion Management)等技術,這都有助于讓每個使用者都公平地使用記憶體資源。

從Jeff Wittich的介紹中了解到,下一階段,Ampere将推出12記憶體通道版本的ApmereOne。同時,為了擴大在雲原生領域的優勢,Ampere在未來還将推出更多核心的處理器。

多核處理器将會讓單路伺服器市場走向繁榮

Ampere的多核處理器确實為伺服器市場帶來了一些變化,比如,Ampere這種級别的處理器會讓單路伺服器走向繁榮。

Jeff Wittich認為,單路伺服器市場有明顯的增長動力。

多路伺服器通常是為了彌補算力、核數、記憶體、IO的不足。然而,多路伺服器不僅會提高設計複雜度和成本,在使用方面也會有一些損失。

而當單顆處理器核心足夠多的時候,使用者就沒必要用雙路以及多路伺服器了。

Ampere正式釋出192核處理器,将虛拟機密度提升至x86的4.3倍

成立短短幾年以來,Ampere 的客戶群正在不斷擴大,包括谷歌雲、微軟 Azure、甲骨文雲、阿裡雲、百度雲、京東雲、騰訊雲、火山引擎、UCloud等雲服務提供商(CSP),以及 HPE 和 Supermicro、華勤等等OEM廠商都在使用Ampere的Arm處理器。