據報道,Meta Platforms Inc對外透露,其研究團隊建造了一款新的人工智能超級計算機,這台超級計算機被命名為“AI研究超級叢集”(RSC),包含16,000個英偉達A100 GPU,算力達5 EFLOPS(混合精度)。Meta認為,等到2022年年中組裝完成時,它将是世界上最快的AI超級計算機。

Meta表示其RSC将幫助公司建構更好的AI模型。這些模型可以從數萬億執行個體中學習,跨越數百種語言工作,把文本、圖像和視訊放在一起分析,以确定内容是否有害。這項研究不僅将幫助人們在今天使用Meta的服務時保持安全,也能在未來Meta建立元宇宙時發揮同樣作用。
據了解,RSC是近兩年工作的成果,由Meta的人工智能和基礎設施團隊上司,合作夥伴包括業内知名的幾家公司,比如英偉達、Penguin Computing Inc和Pure Storage Inc。目前RSC的第一階段已經啟動并運作,它由760個Nvidia DGX A100系統組成,總共包含6080個GPU。
Meta指出在标準的機器視覺研究任務中,RSC的性能已經提高了20倍,預計第二階段将于2022年搭建完成,等到完全建成時,RSC将總共擁有16,000個GPU,能在大到1艾位元組的資料上使用超過一萬億個參數來訓練人工智能,将成為使用A100數量最多的超算。
此外,Meta的研究團隊表示他們還希望RSC能夠幫助建構全新的AI系統,為了滿足AI訓練日益增長的帶寬和容量需求,Meta開發了一種存儲服務,即人工智能研究商店(AIRStore),可以提供16TB/s的存儲帶寬和EB級别的存儲容量。
據悉,為了滿足隐私和安全要求,資料從存儲系統到GPU的整個鍊路都是端到端加密的,直到訓練前才會被解密。而且在導入RSC之前,資料都必須經過隐私審查程式,以保證被正确地匿名化。而且RSC與網際網路也是隔離,沒有直接的入站或出站連接配接,流量隻能來自Meta的生産資料中心。