天天看點

英偉達正在研究各種多晶片GPU設計方案,可根據不同工作負載做針對性組合

英偉達下一代将面向資料中心和消費市場,分别推出基于Hopper架構和Ada Lovelace架構的GPU。有所不同的是,英偉達隻在Hopper架構GPU上采用MCM多晶片封裝,Ada Lovelace架構GPU仍會保留傳統的設計,并不會像AMD基于RDNA 3架構的Navi 31那樣,将MCM多晶片封裝引入到消費級GPU。

英偉達正在研究各種多晶片GPU設計方案,可根據不同工作負載做針對性組合

近期,英偉達研究人員發表了一篇文章,詳細介紹了英偉達正在探索如何為未來産品部署多晶片設計方案。随着異架構計算的興起,英偉達正在尋找一種方法,增加其半導體設計的靈活性,以根據工作負載的不同,靈活比對各種子產品,這也是MCM多晶片封裝的用武之地。

英偉達對多晶片設計的研究最早是在2017年被曝光,當時英偉達展示了通過四個小晶片建構的設計方案,不但提升了性能,還有助于提高産量(較小的晶片良品率會提高),而且還允許将更多的計算資源集合在一起。多晶片設計還有助于提高供電效率,以及有更好的散熱效果。

英偉達目前在MCM多晶片封裝GPU上的做法稱為“Composable On Package GPU”,或COPA。文章裡闡述了英偉達如何處理HPC和AI工作負載之間的差異,随着兩者計算需求的變化,對計算的要求也漸行漸遠。英偉達擔心,過于單一的GPU架構,會逐漸失去HPC和AI工作負載中的計算優勢,而兩者的市場規模卻在日益增長。

英偉達正在研究各種多晶片GPU設計方案,可根據不同工作負載做針對性組合

為了更好地應對未來的計算需求,英偉達一直在模拟不同的多晶片設計和配置,确認不同工作負載所需要的硬體子產品情況。根據英偉達提供的資料,在HPC工作負載上,減少25%的顯存帶寬實際上隻降低了4%的性能,如果再減少25%,性能損失則再增加10%。是以,減少50%的顯存帶寬并移除相關硬體子產品後,可以替換成更合适的硬體子產品,為對應的工作負載提供相應的性能,進而提高效率。由于并不是所有硬體子產品都是對等的,個别功能是不可或缺的,COPA是英偉達嘗試模拟多晶片設計的影響,以及與性能之間的關系。

英偉達目前優先考慮的是HPC和AI市場,除了高利潤的因素以外,不少企業通過定制解決方案的做法逐漸蠶食着英偉達的市場空間。當然,這種根據工作負載做針對性配置的做法也可以應用與英偉達其他GPU産品線,包括消費市場的GeForce顯示卡。不過與專業市場不同,遊戲中的渲染工作方式有着本質上的差別,如果采用多晶片設計,則需要進一步提高小晶片之間的互聯速度。

英偉達正在研究各種多晶片GPU設計方案,可根據不同工作負載做針對性組合

此前AMD已談及了其3D堆棧技術的發展方向,表示封裝選擇和晶片架構取決于具體産品的性能、功率、面積和成本,AMD稱之為PPAC。如果将已經釋出和即将推出的産品包括在内,AMD有14種多層小晶片設計的封裝架構正在進行中。AMD認為,未來屬于多晶片的子產品化設計和比對協調的封裝。

AMD已認證X3D封裝的産品邁出了第一步,在CPU上展示了對成本、功耗和性能等方面的影響。在GPU上采用同樣的設計會更為困難,不過技術的發展最終會推動英偉達實作多晶片設計的目标,即由多個不同功能子產品的小晶片組成GPU,可以根據工作負載的計算需求做出更專業化的組合。

繼續閱讀