揭秘Meta追趕AI新武器：兩款自研晶片，還有一台超級計算機

劃重點：

1Meta在采用對人工智能友好的硬體系統方面始終行動遲緩，這削弱了其與谷歌和微軟等公司競争的能力，為此該公司在内部自研了兩款晶片，并建構人工智能超算。
2Meta釋出了名為MTIA的訓練和推理加速器晶片，這種晶片能夠用于訓練人工智能模型，也能支援運作它們，計劃于2025年推出。
3Meta還在開發名為MSVP的晶片來處理特定類型的計算工作負載。它是Meta内部開發的第一個專用內建電解決方案，專為視訊點播和實時流媒體的處理需求而設計。
4Meta正在内部組裝人工智能超級計算機，并用其來訓練大語言模型LLaMA。

騰訊科技訊 5月19日消息，過去幾年，Facebook母公司Meta在元宇宙上投入巨資，并不斷緻力于相關硬體和軟體的開發，甚至可能為此忽略了人工智能領域的最新趨勢。但随着生成式人工智能爆火，Meta似乎重新調整了公司方向，開始在人工智能領域發力。美國當地時間周四，Meta釋出了兩款用于人工智能的自研晶片，并透露了其在人工智能超算方面取得的最新進展。

在周四的虛拟活動中，Meta展示了其為人工智能工作負載開發的内部基礎設施，包括支援運作生成式人工智能，該公司在新推出的廣告設計和創作工具中都內建了這種新技術。這是Meta展示實力的一次嘗試。此前，該公司在采用對人工智能友好的硬體系統方面始終行動遲緩，這削弱了其與谷歌和微軟等競争對手保持同步的能力。

Meta負責基礎設施的副總裁亞曆克西斯·比約林說：“建立我們自己的硬體能力，使我們能夠控制從資料中心設計到教育訓練架構的每一層堆棧。這種水準的垂直整合是推動人工智能研究向前發展的必要條件。”

在過去十年左右的時間裡，Meta花費了數十億美元招募頂級資料科學家，并建構了新型人工智能，包括現在為其應用和服務中的發現引擎、稽核過濾器和廣告推薦提供支援的人工智能。但該公司始終難以将許多雄心勃勃的人工智能研究創新轉化為産品，尤其是在生成式人工智能方面。

直到2022年，Meta才通過使用CPU和為加速人工智能算法而設計的定制晶片來運作其人工智能工作負載。但Meta取消了原計劃于2022年大規模推出的定制晶片，因為這需要對其幾個資料中心進行重大重新設計，它轉而訂購了價值數十億美元的英偉達GPU。

AI加速器晶片

為了扭轉局面，Meta計劃開始開發一種更雄心勃勃的内部晶片，并定于2025年推出。這種晶片能夠用于訓練人工智能模型，也能支援運作它們。

Meta将這款新晶片稱為Meta訓練和推理加速器，簡稱MTIA，并将其歸類為加速人工智能訓練和推理工作負載的“晶片家族”。“推理”指的是運作某個經過訓練的模型。MTIA是一種專用內建電路(ASIC），即将不同電路組合在一塊電路闆上的晶片，允許被程式設計以并行執行一個或多個任務。

圖1：為人工智能工作負載定制的人工智能晶片

比約林繼續說道：“為了在我們的重要工作負載中獲得更好的效率和性能，我們需要一個與模型、軟體堆棧和系統硬體共同設計的定制解決方案。這為我們的使用者在各種服務上提供了更好的體驗。”

定制人工智能晶片越來越成為大型科技公司的主打産品。谷歌開發了一種處理器TPU（張量處理單元），用于訓練PaLM-2和Imagen等大型生成式人工智能系統。亞馬遜向AWS客戶提供專有晶片，用于教育訓練(Trainium)和推理(Inferentia)。據報道，微軟正在與AMD合作開發一款名為“雅典娜”的内部人工智能晶片。

Meta表示，該公司在2020年開發了第一代MTIA（MTIA v1），并使用7納米工藝生産。它可以從128 MB的記憶體擴充到128 GB，在Meta設計的基準測試中，Meta聲稱MTIA能比GPU更有效地處理“低複雜度”和“中複雜度”的人工智能模型。

Meta表示，在晶片記憶體和網絡領域仍有很多工作要做，随着人工智能模型規模的增長，這些領域都還存在瓶頸，需要将工作負載分散到多個晶片上。令人覺得巧合的是，Meta最近收購了英國晶片獨角獸Graphcore位于奧斯陸的人工智能網絡技術團隊。就目前而言，MTIA的重點是針對Meta應用系列的“推薦工作量”上進行嚴格的推理，而不是教育訓練。

但Meta強調，在運作推薦工作負載時，不斷改進的MTIA“大大”提高了公司的效率，進而使Meta能夠運作“更多增強”和“尖端”的人工智能工作負載。

人工智能超級計算機

也許将來有一天，Meta會将其大部分人工智能工作負載交給MTIA負責。但目前，這家社交網絡巨頭依靠的是其專注于研究的超級計算機Research SuperCluster。

Research SuperCluster于2022年1月首次亮相，由企鵝計算、英偉達和Pure Storage合作組裝，目前已經完成了第二階段的建設。Meta表示，Research SuperCluster現在總共包含2000個英偉達DGX A100系統，配備16000個英偉達A100 GPU。

那麼，Meta為什麼要在内部建造超級計算機呢？首先，這裡有其他科技巨頭帶來的壓力。幾年前，微軟對其與OpenAI合作開發的人工智能超級計算機進行了大肆宣傳，最近又表示将與英偉達合作，在Azure雲上建構新的人工智能超級計算機。同時，谷歌也在吹捧自己的人工智能超級計算機，該計算機擁有26000個英偉達H100 GPU，遠遠超過Meta的超算。

圖2：Meta公司用于人工智能研究的超級計算機

但Meta表示，除了保持與其他同行同步，Research SuperCluster還允許其研究人員使用Meta系統中的現實世界示例來訓練模型。這與該公司之前的人工智能基礎設施不同，後者隻能利用開源和公開可用的資料集。

Meta發言人表示：“Research SuperCluster人工智能超級計算機用于推動人工智能研究在幾個領域的發展，包括生成式人工智能。這實際上與人工智能研究的工作效率息息相關。我們希望為人工智能研究人員提供最先進的基礎設施，使他們能夠開發模型，并為他們提供一個促進人工智能發展的教育訓練平台。”

在其巅峰時期，Research SuperCluster的計算能力可以達到5 exaflop，Meta聲稱這是世界上最快的計算機之一。Meta表示，它使用Research SuperCluster來訓練大語言模型LLaMA。今年早些時候，Meta向研究人員開放了“封閉釋出”的大語言模型通路權限。Meta說，最大的LLaMA模型在2048個A100 GPU上進行了訓練，耗時21天。

Meta發言人稱：“Research SuperCluster将幫助Meta的人工智能研究人員建立新的、更好的人工智能模型，這些模型可以從數萬億個例子中學習，工作跨越數百種不同的語言，無縫地分析文本、圖像和視訊，以及開發新的增強現實工具等。”

視訊轉碼器

除了MTIA， Meta還在開發另一種晶片來處理特定類型的計算工作負載。這款晶片被稱為Meta可擴充視訊處理器，簡稱MSVP，它是Meta内部開發的第一個專用內建電路(ASIC)解決方案，專為應對視訊點播和流播的處理需求而設計。

有些人可能還記得，Meta多年前就開始構思定制的伺服器端視訊晶片，并在2019年宣布了一款用于視訊轉碼和推理工作的ASIC。MSVP就是這些努力的成果之一，也是在流播領域重新推動競争的結果。

Meta技術主管哈裡克裡希納·雷迪和陳雲青（音）在他們合著的部落格文章中寫道：“僅在Facebook上，人們就把50%的時間花在了觀看視訊上。我們需要服務于世界各地的各種裝置(如移動裝置、筆記本電腦、電視等)，例如上傳到Facebook或Instagram的視訊被轉碼成多個比特流，它們具有不同的編碼格式、分辨率和品質，MSVP是可程式設計和可擴充的，可以配置為有效地支援VOD所需的高品質轉碼，以及直播所需的低延遲和更快的處理時間。”

圖3：Meta的定制晶片旨在加速視訊工作負載，如流播和轉碼

Meta表示，該公司的計劃是最終将大部分“穩定而成熟”的視訊處理工作負載轉移給MSVP，隻對需要特定定制和“顯著”提高品質的工作負載使用軟體視訊編碼。Meta還稱，通過智能去噪和圖像增強等預處理方法，以及僞影去除和超分辨率等後期處理方法，MSVP在提高視訊品質方面的工作仍在繼續。

雷迪和陳雲青稱：“将來，MSVP将使我們能夠支援更多Meta最重要的用例和需求，包括短視訊，進而實作生成式人工智能、AR/VR和其他虛拟現實内容的高效傳遞。”

人工智能焦點

如果說最新硬體公告中有一個共同點的主線，那就是Meta正在拼命加快人工智能的發展步伐，特别是在生成式人工智能方面。

今年2月，據稱Meta首席執行官馬克·紮克伯格已将提升Meta的人工智能計算能力作為首要任務，他宣布成立新的頂級生成式人工智能團隊，用他的話說，這将為公司的研發“渦輪增壓”。Meta首席技術官安德魯·博斯沃思最近也表示，生成式人工智能是他和紮克伯格花費最多時間的領域。據Meta首席科學家楊立昆透露，該公司計劃部署生成式人工智能工具，在虛拟現實中創造物品。

今年4月，紮克伯格在Meta第一季度财報電話會議上表示：“我們正在探索WhatsApp和Messenger的聊天體驗，Facebook和Instagram上的文章和廣告的視覺創作工具，以及随着時間推移的視訊和多模式體驗。我希望這些工具對每個人都有價值，從普通人到創作者再到企業都是如此。例如，我預計，一旦我們獲得了這種體驗，就會有很多人對商業資訊傳遞和客戶支援方面的人工智能代理産生興趣。随着時間的推移，這也将擴充到我們在虛拟世界的工作中，在那裡人們将更容易建立化身、對象、世界和将所有這些聯系在一起的代碼。”

在某種程度上，Meta正感到到越來越大的壓力，投資者擔心該公司的行動不夠快，無法在生成式人工智能的巨大潛在市場分一杯羹。目前，該公司還沒有推出可與Bard、必應或ChatGPT等聊天機器人競争的産品。在圖像生成方面也沒有取得太大進展，這是另一個爆炸式增長的關鍵領域。

如果這些預測是正确的，生成式人工智能軟體的總目标市場規模可能達到1500億美元。美國投行高盛預測，這将使GDP增長7%。

即使部分預測成真，也可以彌補Meta在增強現實頭盔、會議軟體和Horizon Worlds等元宇宙技術上的數十億美元投資損失。Meta負責增強現實技術的部門Reality Labs上個季度淨虧損40億美元，預計整個2023年的營運虧損将繼續增加。（金鹿）

揭秘Meta追趕AI新武器：兩款自研晶片，還有一台超級計算機

繼續閱讀

印媒：中國可以突破美國封鎖制造出先進晶片，為什麼印度做不到？

華為Pura70系列搭載新款麒麟晶片，它的亮點能撐起這個定價嗎？

華為pura7系列用的麒麟9010晶片。性能如下，自己腦補！

美聯儲鷹聲擊落美債，标普納指五連跌，台積電指引打壓晶片股

英特爾“中國定制版”AI晶片：性能降至8%，為赢得利益還是同情？

光伏和晶片雙科第一龍頭利潤劇增850%高毅等716家機構重倉！

人工智能、物聯網、大資料等資訊技術廣泛應用——為鄉村全面振興插上“數字翅膀”

Meta 釋出最新人工智能模型 Llama 3；特斯拉全球裁員已推出賠償方案，馬斯克道歉；華為 Pura 70 系列一分鐘售罄｜極客早知道

國有企業如何發展人工智能

吉利自研首款國産7nm車規級晶片龍鷹一号，成功打破卡脖子難題

《晶片戰争》，讀懂世界最關鍵技術的争奪戰

美聯儲鷹聲擊落美債，标普納指五連跌，台積電指引打壓晶片股，AI“護體”英偉達、Meta反彈，奈飛盤後跳水

微軟展示VASA-1人工智能模型能将照片變成"會說話的人臉"

HMD Pulse Pro 手機渲染圖曝光：展銳 T606 晶片 + 5000 萬主攝

OPPO A3 Pro手機開售：IP69級防護、天玑7050晶片，1999元起

早報：Mate70将預裝純血鴻蒙蘋果M4晶片或年底前亮相