Ampere正式釋出192核處理器，将虛拟機密度提升至x86的4.3倍

2023年5月下旬，Ampere正式釋出AmpereOne系列處理器，單顆處理器支援最高192個實體核心，遠遠超過目前AMD最多96核心的EPYC和英特爾60核的至強處理器。

與之前的Ampere Altra和Ampere Altra Max一樣，AmpereOne也是單實體核單線程的設計，這樣設計的好處是可以避免雙線程之間，互相争搶資源造成的性能抖動。

由于延續了這一思路，使得它與之前的Ampere Altra系列一樣，也可以提供可預測的高性能，提供較強的彈性和可擴充性，具備高能效和可持續性優勢。

AmpereOne的基本參數資訊

AmpereOne出現以前，Ampere Altra系列最多128核心，新的AmpereOne則是從136核起步，最多192核心。是以，AmpereOne可以看做是Ampere Altra的補充，兩者将長期共存。

Ampere Computing首席産品官Jeff Wittich表示，當使用者需要在邊緣計算場景部署時，可以選擇32核、功耗40瓦的Ampere Altra處理器，對于算力需求更大的資料中心使用者，可以選擇核數更多，性能更好的處理器。

Ampere Altra系列采用的是7nm，而AmpereOne系列采用的是台積電5nm。核心方面，Ampere強調核心是自研的，由Ampere自有IP全新打造(Arm ISA沒變，是以不存在相容性問題)，這使得Ampere可以根據需求做更多改動。

AmpereOne的部分參數規格（L2 Cache翻倍）

能看到，AmpereOne的核心規格有明顯變化，每個核心專有L2緩存從原來的1MB提升到了2MB，對性能提升應該很有幫助。但L1的指令緩存從原來的64KB，縮小為16KB。

功耗方面，Ampere Altra的TDP為40-180瓦，而AmpereOne則是200-350瓦。算下來，每個核心的平均TDP相較于之前有所增長。

AmpereAltra的部分參數規格

AmpereOne支援PCIe Gen5和DDR5記憶體。PCIe通道數還是128個，記憶體通道依然是8通道。DDR5最大容量翻倍，而AmpereOne支援的最大記憶體容量也從4TB提升到了8TB。

此外，Ampere Altra的最高主頻為3G，AmpereOne也完全保持一緻。較低的主頻，帶來較低的工作電壓和較低的功耗，還能讓核心持續穩定在固定頻率上，進而帶來穩定的性能表現。

以更少的功耗輸出更多性能

AmpereOne跟隔壁x86處理器完全不一樣套路，單機架可提供的性能遠高于x86處理器。同時，在節省能耗和節省占地空間方面也有非常大的優勢。

Ampere将能效比優勢視為一大亮點。有調研資料顯示，資料中心貢獻了3%以上的碳排放量，是不折不扣的排放大戶，從節能減排的角度講，AmpereOne非常有優勢。

Ampere還提到了全球多地能源價格飛漲的現狀，這些也都會直接影響資料中心的營運成本，對于這些地區的資料中心營運者來說，能效比占優的Ampere非常具有吸引力。

新增BF16計算精度，提高AI推理能力

Ampere還提到了AmpereOne在AI推理方面的優勢，這得益于在FP16，Int16，Int8基礎上新增的對BF16的支援。

在運作文生圖的模型Stable Diffusion時，AmpereOne每秒生成的圖檔幀率是AMD EPYC 9654的2.3倍。

在運作智能推薦模型DLRM（Deep Learning Recommendation Model）時，AmpereOne每秒能處理的推薦次數是AMD EPYC 9654的2倍以上。

Jeff Wittich表示，AmpereOne系列處理器設計過程中考慮到了AI的需求。

軟體層面，Ampere收購了AI軟體公司OnSpecta，進而讓Ampere處理器更好地運作AI相關負載。硬體層面，AmpereOne系列處理器新增了對于BF16計算精度的支援。

據了解，目前已經有許多企業都在使用Ampere Altra系列處理器做AI推理，用着Ampere官方Library庫，包括TensorFlow、PyTorch、ONNX等主流架構。

更适合雲計算場景的處理器

Ampere一直喜歡強調自家做的叫雲原生處理器，意在凸顯它非常适合用在公有雲的場景。然而，最能展現它适合雲場景就是對虛拟機的支援。

如上圖所示，由于核心比較多，單個Rack能支援更多的虛拟機，更多的虛拟機可以賣給更多的使用者，能幫雲廠商産生更多經濟效益。

為了用如此之多的核心穩定地支援更多使用者，Ampere在記憶體管理上做了很多優化。

在面對記憶體牆和可能存在的記憶體不均衡問題時，Jeff Wittich表示，AmpereOne擁有更高的記憶體帶寬，更好的帶寬管理技術，新的Chiplet技術，新的網格擁塞管理（Mesh Congestion Management）等技術，這都有助于讓每個使用者都公平地使用記憶體資源。

從Jeff Wittich的介紹中了解到，下一階段，Ampere将推出12記憶體通道版本的ApmereOne。同時，為了擴大在雲原生領域的優勢，Ampere在未來還将推出更多核心的處理器。

多核處理器将會讓單路伺服器市場走向繁榮

Ampere的多核處理器确實為伺服器市場帶來了一些變化，比如，Ampere這種級别的處理器會讓單路伺服器走向繁榮。

Jeff Wittich認為，單路伺服器市場有明顯的增長動力。

多路伺服器通常是為了彌補算力、核數、記憶體、IO的不足。然而，多路伺服器不僅會提高設計複雜度和成本，在使用方面也會有一些損失。

而當單顆處理器核心足夠多的時候，使用者就沒必要用雙路以及多路伺服器了。

成立短短幾年以來，Ampere 的客戶群正在不斷擴大，包括谷歌雲、微軟 Azure、甲骨文雲、阿裡雲、百度雲、京東雲、騰訊雲、火山引擎、UCloud等雲服務提供商（CSP），以及 HPE 和 Supermicro、華勤等等OEM廠商都在使用Ampere的Arm處理器。