周周更新月月上新的AI晶片都是啥？5分鐘搞明白AI晶片

一鍵生成會議紀要，一句話創造一個AI應用，曾經費時費力的任務，如今在AI的幫助下變得輕而易舉。AI的“魔法”不僅僅展現在這些日常辦公的場景中，它還在改變着我們的生活方式。從智能推薦系統為我們提供個性化的娛樂選擇，到自動駕駛技術讓出行更加安全和便捷，AI無疑正在為我們的生活帶來前所未有的便利與高效。

然而，這一切的“魔法”背後，有一個不可或缺的“魔法師”——AI晶片。它就像AI的“大腦”，處理着海量的資料，驅動着各種複雜的算法。為了應對AI應用對硬體性能的更高要求，科技巨頭們紛紛推出了自家的AI晶片，如NVIDIA的H200、谷歌的TPU，以及被Intel、AMD、高通和蘋果等內建在電腦産品中的NPU。

AI晶片如今已成為科技巨頭們競相研發的重點産品，每天都有大量的新聞和最新進展報告，今天我就帶大家好好扒一扒這些AI晶片。

GPU：NVIDIA H100/200、AMD Instinct MI300、Intel Gaudi 3

提到AI就會讓我們想到GPU，好像GPU已經和AI深度綁定了！确實，在人工智能（AI）領域，圖形處理器（GPU）具有先天的優勢。GPU的高效并行處理能力使其成為AI算法中數學計算的理想選擇，特别适合處理AI中大量的矩陣運算和深度學習任務。相比于中央處理器（CPU），GPU能夠更快地執行複雜的計算任務，進而大幅提高AI模型的訓練和推理速度。

此外，GPU的并行架構也使其能夠同時處理多個資料塊，這對于處理AI中的大規模資料集至關重要。在深度學習領域，GPU的這種能力被廣泛應用于加速神經網絡的訓練和推理過程，進而顯著提升了AI應用的性能和效率。

不僅如此，GPU還提供了高度優化的庫和工具，使得開發人員能夠更輕松地實作高效的AI算法。這些庫和工具為AI研究人員和工程師提供了強大的支援，使他們能夠更快速地開發出高效的AI應用。

目前比較具有代表性的産品包括NVIDIA H100/200、AMD Instinct MI300等。由于大型科技公司如谷歌、微軟等，都在雲端大量部署了大量GPU，以提供強大的算力支援，于是NVIDIA憑借GPU成功跻身萬億市值俱樂部。

FPGA：AMD Versal AI Edge

FPGA相比于CPU、GPU對于普通使用者來說似乎很陌生，簡單來說FPGA相當于一種“萬能”晶片，它可以根據需要被重新程式設計，執行各種不同的任務。這意味着，如果你需要執行某種特定的計算任務或者處理某種特定的資料，你可以通過程式設計來“定制”FPGA上的硬體邏輯，使其以最高效的方式完成這項工作。這就像是你可以根據需要，随時更換瑞士軍刀上的工具一樣。

是以，FPGA在需要高度定制化和靈活性的應用中表現出色，使得FPGA能夠适應不同的AI需求，并通過硬體級别的優化提升性能，常見于深度學習加速、視訊圖像處理、自然語言處理等。

FPGA的優勢在于其高性能、低延遲以及強大的并行計算能力，這使得它在處理複雜的AI算法和大規模資料時表現出色。同時，FPGA還具有成本效益和功耗優勢，非常适合于功耗敏感或需要長期運作的應用場景。

ASIC：Google TPU、AWS Trainium、Azure Maia

在AI領域，各大科技巨頭如Google、AWS和Azure都開發了自己的專用AI加速晶片，如Google的TPU（Tensor Processing Unit）、AWS的Trainium以及Azure的Maia。這些晶片都是ASIC（應用特定內建電路）的一種，專為各自公司的AI服務而定制開發，以提供高效的計算能力和優化的性能。這些晶片通常不單獨對外銷售，而是作為公司内部服務的一部分，用于提升自身的AI處理能力和服務品質。

相比之下，NVIDIA、AMD和Intel等公司則專注于生産面向廣泛市場的AI加速硬體，如針對AI優化的GPU（圖形處理單元）。這些公司的産品可以被各種不同的公司購買和使用，以滿足其在AI應用運算方面的需求。簡而言之，前者是科技公司為自家服務定制的“私家晶片”，而後者則是面向市場的“大衆晶片”。

類腦晶片：IBM TrueNorth、Intel Loihi 2

類腦晶片是一種全新的處理器,其設計靈感來自于模仿人腦神經系統的結構和功能。不同于傳統的基于馮·諾依曼架構的CPU/GPU晶片,類腦晶片借鑒了神經科學和仿生學的理念,通過模拟神經元的連接配接和資訊傳遞方式,實作了高效的并行計算和自适應學習能力。

在人工智能領域，類腦晶片展現出諸多獨特優勢。首先，大規模并行的神經元結構使其計算能力遠超傳統晶片，能同時高效處理海量資料。其次，類腦晶片具備神經可塑性，可根據應用場景自主優化網絡權重，不斷提升智能化水準。此外，低功耗的事件驅動設計也使類腦晶片尤為适用于移動端和物聯網等對能耗敏感的領域。

目前，IBM和英特爾是類腦晶片研發的代表性公司。IBM的TrueNorth是神經形态計算領域的開拓者之一。而英特爾最新推出的Hala Point系統則基于Loihi 2神經拟态處理器,內建了140544個神經形态處理核心,總計模拟11.5億個神經元和1280億個突觸連接配接,實作了每秒20千萬億次運算的極高效能,能效比遠超GPU和CPU架構,開辟了類腦計算的新境界。

那麼問題來了，Intel、AMD、高通和蘋果等內建在電腦處理器裡的NPU，算是什麼呢？

NPU(神經網絡處理器)屬于ASIC(專用內建電路)類型的AI晶片，主要優勢在于專門為AI推理場景量身定制，在算力密度、能效比和低延遲推理性能方面都有天然優勢。英特爾NPU、蘋果Neural Engine、高通Hexagon AI Engine等都針對移動/物聯網等終端裝置場景進行了優化，與雲端的大規模AI加速器(如Google TPU、AWS Trainium)定位不同。

相比之下，GPU作為通用的并行計算加速器，由于架構靈活、并行度高，非常适合深度學習的訓練過程。但GPU在推理加速方面還有待進一步優化，無法像專用的NPU那樣獲得極緻的能效比和低延遲表現。

總的來說，NPU是為AI推理過程量身定制的高效加速晶片，而GPU則是通用加速器，更适合訓練環節。兩者在AI加速領域形成良好的分工和互補。是以，針對終端使用者的AI個人計算機，intel、AMD、高通、微軟都将CPU+GPU+NPU的本地異構算力作為AI PC定義的必要條件。這種融合多種處理核心的混合架構，能夠最大限度地發揮不同硬體的長處優勢，為AI計算帶來卓越的綜合性能。

但是NVIDIA表示不服，它認為有了RTX獨立顯示卡才是真AI PC！

當然，NVIDIA絕對有底氣來挑戰AI PC的定義，因為在AI時代，算力是至關重要的，目前大多數NPU都是與CPU和內建顯示卡晶片一體化設計，功耗受到一定限制，使用場景主要圍繞持續低負載的AI任務，如視訊會議增強、圖像處理等，算力通常在10-45TOPS的範圍。

相比之下，英偉達憑借多年來在GPU研發上的深耕細作，推出了堪稱"地表最強"的RTX系列顯示卡。單張RTX顯示卡的AI加速能力即可輕松突破100TOPS，旗艦型号更是高達1300+TOPS的駭人水準，完全能夠承載本地的大型語言模型等複雜AI工作負載。

此外，英偉達在AI軟體生态建設上也未馀遺力。全球範圍内已有125+款RTX加速的AI應用橫跨圖像/視訊編輯、3D模組化渲染等多個領域，可為創作者和開發者帶來高達10倍的性能提升。配合英偉達獨有的AI SDK，開發者能夠最大限度地挖掘RTX顯示卡的AI加速潛能。

不可否認，NPU的确憑借低功耗設計在持續性AI任務上表現出衆，但要論及極緻算力和通用AI應用加速，英偉達RTX系列仍是目前無可匹敵的王者級方案。在終端AI的蓬勃發展時代，硬體供應商們在推進異構架構整合的同時，也将在算力大戰中激烈競逐。

周周更新月月上新的AI晶片都是啥？5分鐘搞明白AI晶片

繼續閱讀

晶片巨頭英偉達市值超越蘋果：技術變革與産業新機遇

叫闆蘋果MacBook？華碩無畏Pro15新品上架，這顆骁龍AI晶片不一般

明明PC端的骁龍晶片不弱？為什麼很少廠商使用呢？如今性能直接對标蘋果M3的骁龍XElite一來，局面不僅改變，而且還進一

618的蘋果也不過如此，128G的iPhone15看上去很香，但合适日常用的256G卻要5000多！這價格和不少國産頂級

好家夥，華為這是打了多人的臉！很多人說華為Pura70主賣線下，線上的懂哥不會看一眼的，但人家卻經常拿下新機銷量第一！這

三星Galaxy Watch 7/Ultra智能手表曝光：32GB存儲、3nm晶片

晶片戰争新思路：用英偉達的方式，抗衡英偉達

HTC U24 系列手機官宣 6 月 12 日釋出，骁龍 7 Gen 3 晶片加持

晚上又是加班到很晚才回來，這時發現樓上的女房東已經守候在了門外。我很不高興的問她到底有什麼事？隻見她低着頭支支吾吾問我，

40億，今年最大晶片融資誕生了

華為新殺手锏，晶片制造商揭曉麒麟9000s來源謎底！

電車好？還是油車好？油車20萬，10年，油費10萬，賣2萬電車20萬，10年，電費5千，賣2萬油電混動，10年，費用4萬

比晶片難度更高！美日全部壟斷，中國企業連山寨版的都造不出

比晶片難度還要高！全部由美日壟斷，中國連山寨版的都造不出？

從3440億晶片基金，到中國制造房地産，中國經濟的制勝之道

為什麼晶片公司紛紛跑到德國建廠？