天天看點

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

作者:PConline太平洋科技

一鍵生成會議紀要,一句話創造一個AI應用,曾經費時費力的任務,如今在AI的幫助下變得輕而易舉。AI的“魔法”不僅僅展現在這些日常辦公的場景中,它還在改變着我們的生活方式。從智能推薦系統為我們提供個性化的娛樂選擇,到自動駕駛技術讓出行更加安全和便捷,AI無疑正在為我們的生活帶來前所未有的便利與高效。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

然而,這一切的“魔法”背後,有一個不可或缺的“魔法師”——AI晶片。它就像AI的“大腦”,處理着海量的資料,驅動着各種複雜的算法。為了應對AI應用對硬體性能的更高要求,科技巨頭們紛紛推出了自家的AI晶片,如NVIDIA的H200、谷歌的TPU,以及被Intel、AMD、高通和蘋果等內建在電腦産品中的NPU。

AI晶片如今已成為科技巨頭們競相研發的重點産品,每天都有大量的新聞和最新進展報告,今天我就帶大家好好扒一扒這些AI晶片。

GPU:NVIDIA H100/200、AMD Instinct MI300、Intel Gaudi 3

提到AI就會讓我們想到GPU,好像GPU已經和AI深度綁定了!确實,在人工智能(AI)領域,圖形處理器(GPU)具有先天的優勢。GPU的高效并行處理能力使其成為AI算法中數學計算的理想選擇,特别适合處理AI中大量的矩陣運算和深度學習任務。相比于中央處理器(CPU),GPU能夠更快地執行複雜的計算任務,進而大幅提高AI模型的訓練和推理速度。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

此外,GPU的并行架構也使其能夠同時處理多個資料塊,這對于處理AI中的大規模資料集至關重要。在深度學習領域,GPU的這種能力被廣泛應用于加速神經網絡的訓練和推理過程,進而顯著提升了AI應用的性能和效率。

不僅如此,GPU還提供了高度優化的庫和工具,使得開發人員能夠更輕松地實作高效的AI算法。這些庫和工具為AI研究人員和工程師提供了強大的支援,使他們能夠更快速地開發出高效的AI應用。

目前比較具有代表性的産品包括NVIDIA H100/200、AMD Instinct MI300等。由于大型科技公司如谷歌、微軟等,都在雲端大量部署了大量GPU,以提供強大的算力支援,于是NVIDIA憑借GPU成功跻身萬億市值俱樂部。

FPGA:AMD Versal AI Edge

FPGA相比于CPU、GPU對于普通使用者來說似乎很陌生,簡單來說FPGA相當于一種“萬能”晶片,它可以根據需要被重新程式設計,執行各種不同的任務。這意味着,如果你需要執行某種特定的計算任務或者處理某種特定的資料,你可以通過程式設計來“定制”FPGA上的硬體邏輯,使其以最高效的方式完成這項工作。這就像是你可以根據需要,随時更換瑞士軍刀上的工具一樣。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

是以,FPGA在需要高度定制化和靈活性的應用中表現出色,使得FPGA能夠适應不同的AI需求,并通過硬體級别的優化提升性能,常見于深度學習加速、視訊圖像處理、自然語言處理等。

FPGA的優勢在于其高性能、低延遲以及強大的并行計算能力,這使得它在處理複雜的AI算法和大規模資料時表現出色。同時,FPGA還具有成本效益和功耗優勢,非常适合于功耗敏感或需要長期運作的應用場景。

ASIC:Google TPU、AWS Trainium、Azure Maia

在AI領域,各大科技巨頭如Google、AWS和Azure都開發了自己的專用AI加速晶片,如Google的TPU(Tensor Processing Unit)、AWS的Trainium以及Azure的Maia。這些晶片都是ASIC(應用特定內建電路)的一種,專為各自公司的AI服務而定制開發,以提供高效的計算能力和優化的性能。這些晶片通常不單獨對外銷售,而是作為公司内部服務的一部分,用于提升自身的AI處理能力和服務品質。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

相比之下,NVIDIA、AMD和Intel等公司則專注于生産面向廣泛市場的AI加速硬體,如針對AI優化的GPU(圖形處理單元)。這些公司的産品可以被各種不同的公司購買和使用,以滿足其在AI應用運算方面的需求。簡而言之,前者是科技公司為自家服務定制的“私家晶片”,而後者則是面向市場的“大衆晶片”。

類腦晶片:IBM TrueNorth、Intel Loihi 2

類腦晶片是一種全新的處理器,其設計靈感來自于模仿人腦神經系統的結構和功能。不同于傳統的基于馮·諾依曼架構的CPU/GPU晶片,類腦晶片借鑒了神經科學和仿生學的理念,通過模拟神經元的連接配接和資訊傳遞方式,實作了高效的并行計算和自适應學習能力。

在人工智能領域,類腦晶片展現出諸多獨特優勢。首先,大規模并行的神經元結構使其計算能力遠超傳統晶片,能同時高效處理海量資料。其次,類腦晶片具備神經可塑性,可根據應用場景自主優化網絡權重,不斷提升智能化水準。此外,低功耗的事件驅動設計也使類腦晶片尤為适用于移動端和物聯網等對能耗敏感的領域。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

目前,IBM和英特爾是類腦晶片研發的代表性公司。IBM的TrueNorth是神經形态計算領域的開拓者之一。而英特爾最新推出的Hala Point系統則基于Loihi 2神經拟态處理器,內建了140544個神經形态處理核心,總計模拟11.5億個神經元和1280億個突觸連接配接,實作了每秒20千萬億次運算的極高效能,能效比遠超GPU和CPU架構,開辟了類腦計算的新境界。

那麼問題來了,Intel、AMD、高通和蘋果等內建在電腦處理器裡的NPU,算是什麼呢?

NPU(神經網絡處理器)屬于ASIC(專用內建電路)類型的AI晶片,主要優勢在于專門為AI推理場景量身定制,在算力密度、能效比和低延遲推理性能方面都有天然優勢。英特爾NPU、蘋果Neural Engine、高通Hexagon AI Engine等都針對移動/物聯網等終端裝置場景進行了優化,與雲端的大規模AI加速器(如Google TPU、AWS Trainium)定位不同。

相比之下,GPU作為通用的并行計算加速器,由于架構靈活、并行度高,非常适合深度學習的訓練過程。但GPU在推理加速方面還有待進一步優化,無法像專用的NPU那樣獲得極緻的能效比和低延遲表現。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

總的來說,NPU是為AI推理過程量身定制的高效加速晶片,而GPU則是通用加速器,更适合訓練環節。兩者在AI加速領域形成良好的分工和互補。是以,針對終端使用者的AI個人計算機,intel、AMD、高通、微軟都将CPU+GPU+NPU的本地異構算力作為AI PC定義的必要條件。這種融合多種處理核心的混合架構,能夠最大限度地發揮不同硬體的長處優勢,為AI計算帶來卓越的綜合性能。

但是NVIDIA表示不服,它認為有了RTX獨立顯示卡才是真AI PC!

當然,NVIDIA絕對有底氣來挑戰AI PC的定義,因為在AI時代,算力是至關重要的,目前大多數NPU都是與CPU和內建顯示卡晶片一體化設計,功耗受到一定限制,使用場景主要圍繞持續低負載的AI任務,如視訊會議增強、圖像處理等,算力通常在10-45TOPS的範圍。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

相比之下,英偉達憑借多年來在GPU研發上的深耕細作,推出了堪稱"地表最強"的RTX系列顯示卡。單張RTX顯示卡的AI加速能力即可輕松突破100TOPS,旗艦型号更是高達1300+TOPS的駭人水準,完全能夠承載本地的大型語言模型等複雜AI工作負載。

周周更新月月上新的AI晶片都是啥?5分鐘搞明白AI晶片

此外,英偉達在AI軟體生态建設上也未馀遺力。全球範圍内已有125+款RTX加速的AI應用橫跨圖像/視訊編輯、3D模組化渲染等多個領域,可為創作者和開發者帶來高達10倍的性能提升。配合英偉達獨有的AI SDK,開發者能夠最大限度地挖掘RTX顯示卡的AI加速潛能。

不可否認,NPU的确憑借低功耗設計在持續性AI任務上表現出衆,但要論及極緻算力和通用AI應用加速,英偉達RTX系列仍是目前無可匹敵的王者級方案。在終端AI的蓬勃發展時代,硬體供應商們在推進異構架構整合的同時,也将在算力大戰中激烈競逐。

繼續閱讀