天天看點

Meta首台AI超算出爐!1.6萬塊英偉達GPU加持,算力暴漲20倍

智東西(公衆号:zhidxcom)

編譯 | 趙迪

編輯 | 雲鵬

智東西1月25日消息,據外媒報道,今日,Meta宣布建成一款新的AI超級計算機,名為“AI Research SuperCluster”,簡稱“RSC” ,目前第一階段的RSC已建成,Meta表示其計算性能可提升20倍,但未說明其比較對象,Meta稱,到第二階段的RSC完成時,它将會是世界範圍内速度最快的AI超級計算機。

AI超級計算機能在短時間内處理龐大資料集,訓練更快、更好的AI模型,為Meta建構全新的AI系統。而沉浸式元宇宙在實體計算、圖像渲染等方面對算力的需求龐大,高性能AI超級計算機的建設或能助力Meta進一步提升使用者的元宇宙體驗。

相較一般的超級計算機,AI超級計算機在高精确度上稍有欠缺,但對于AI模型訓練來說,AI超級計算機能在不影響最終結果的情況下大幅度提高計算速度,優化AI模型的效率更高。

一、RSC問世,計算速度世界第五,Meta稱其性能提升20倍

今日,Meta宣稱建造成一台AI超級計算機,這是一台專門為訓練機器學習系統而設計的高速計算機,全稱為“AI Research SuperCluster”,簡寫為“RSC”。該公司表示,目前RSC在世界上最快的超級計算機中排名第五,到2022年年中完工時,RSC将成為世界上最快的AI超級計算機。

約一年半以前,Meta開始了RSC的開發工作,Meta的工程師從頭開始設計了RSC的各個系統,包括冷卻系統、電力系統、網絡系統和電纜系統等等。目前,第一階段的RSC已經建造完成,它由760個英偉達DGX A100系統組成,配備了6080個GPU。Meta表示,在一般的計算機視覺研究任務裡,RSC的性能表現已經提高了20倍,不過Meta未公布與RSC性能表現進行比較的實驗對象。到2022年中,Meta将完成第二階段的RSC開發工作。屆時,RSC将配備約16000塊GPU,能夠在10億位元組的資料集上使用超過1萬億參數來訓練人工智能系統,這一資料集的資料量相當于36000年的高品質視訊。

Meta首台AI超算出爐!1.6萬塊英偉達GPU加持,算力暴漲20倍

▲RSC結構示意圖

此外,Meta的競争對手——微軟和英偉達等也已經宣布建成AI超級計算機,目前,微軟的OpenAI研究實驗室宣布其AI超級計算機配備了1萬個GPU。這表明,人工智能在Meta這類公司中已經被視為研究的中心領域。

二、訓練更優越的AI模型,提升元宇宙體驗

Meta表示,RSC将幫助Meta的AI研究員建立新的、更好的人工智能模型,提升Meta業務中的AI功能,比如檢測Facebook和Instagram中不良資訊的内容稽核算法,未來還可能用于AR(增強現實)裝置,提升使用者在元宇宙中的體驗。Meta首席執行官馬克·紮克伯格(Mark Zuckerberg)周一在Facebook上寫道:“我們為使用者提供的元宇宙體驗需要計算機擁有強大的計算能力,支援數百種不同的語言,能夠無縫分析文本、圖像和視訊,開發新的AR工具。”

Meta首台AI超算出爐!1.6萬塊英偉達GPU加持,算力暴漲20倍

“元宇宙”指的是共享虛拟環境的概念,人們可以通過不同的裝置通路該環境,進行工作、娛樂和社交。沉浸式元宇宙的實作對實體計算、渲染、資料協調和同步、人工智能、動作捕捉和翻譯等方面均有很高要求,為此,算力的提升就成為建設元宇宙的關鍵。AI超級計算機的出現為算力問題的解決提供了一個重要的突破口。

三、AI超級計算機準确度較低,但速度是第一要義

AI超級計算機與通常人們認為的超級計算機不同。人們通常認為的超級計算機一般是由大學或政府主導建設的用于處理核實體、氣候變化等複雜領域的大型計算機。AI超級計算機與之有相似之處,二者在尺寸和外觀上都比單個計算機更接近資料中心,并依賴大量互連處理器以極快的速度交換資料。但二者也存在關鍵的差別。

由于機器學習對準确性的要求相對較低,在使用相同硬體的情況下,AI超級計算機的運算速度比傳統的超級計算機更快。而浮點運算精度的差別決定了二者運算準确性的差異,一般的超級計算機采用IEEE (美國電氣和電子工程師學會)規定的雙精度 64 位浮點數的格式,而AI超級計算機通常采用單精度32位甚至16位浮點數的格式。雖然在精度上有所差别,但AI超級計算機在AI模型訓練上效率更高,更适合企業應用。

結語:AI超級計算機提供算力基礎,Meta聯合英偉達出擊元宇宙

Meta的首台AI超級計算機為AI模型訓練提供了強有力的運算基礎,能夠幫助Meta進一步發展AI相關業務,向元宇宙進軍。預計2022年年中,Meta的AI超級計算機将配備約16000個GPU,比目前微軟釋出的AI超級計算機多出6000個。

Meta開發AI超級計算機的主要目的是訓練更快、更好的AI模型,應用于沉浸式元宇宙建設,這一行動為Meta的元宇宙建設提供了基本的算力基礎。目前,Meta已經與英偉達公司、Pure Storage公司(PSTG.N)和企鵝計算公司(Penguin Computing Inc)的團隊合作建造這台超級計算機,未來,Meta将與這些公司一起實作何種強大的AI功能,令人期待。

來源:The Verge,The Wall Street Journal,Reuters

繼續閱讀