天天看點

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

作者:樂晴行業觀察

AI晶片是算力的硬體基石,主要指針對人工智能算法做了特殊加速設計的晶片。

人工智能晶片多用傳統型晶片,或用昂貴的圖形處理器(GPU),或用現場可程式設計門陣列晶片配合中央處理器(FPGA+CPU)為主, 用以在雲端資料中心的深度學習訓練和推理, 通用/專用型AI晶片(ASIC),也就是張量處理器或特定用途內建電路(ASIC),主要是針對具體應用場景,三類晶片短期内将共存并在不同應用場景形成互補。#人工智能##AI晶片#

AI各類晶片對比:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

在用于深度學習時,四類晶片各有不同:1)通用性:CPU>GPU>FPGA>ASIC,通用性越低,代表其适合支援的算法類型越少;2)性能功耗比:CPU<GPU<FPGA<ASIC,性能功耗比越高越好,意味着相同功耗下運算次數越多,訓練相同算法所需要的時間越短。

深度學習時,四類AI晶片表現有所差異:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

資料來源:快科技

随着海内外科技巨頭加大AI領域的資本開支,這也對資料中心和相關的配套産業帶來更大的需求。據億歐智庫預測,2025年大陸AI晶片市場規模将達1780億元,較2022年增長近100%。

關注樂晴智庫,洞悉産業格局!

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

CPU

CPU是計算機系統的運算和控制核心。

分為通用高性能微處理器、嵌入式微處理器和移動端用SoC MPUs/AP,是電子資訊時代需求量最大,最重要的半導體産品之一。

CPU是一種通用處理器,适用于大多數計算任務。其核心數較少,是以其更适用于單線程或少量線程的任務,例如文本處理、網頁浏覽、程式設計等,對于高性能計算任務,如機器學習、深度學習等,則表現稍顯乏力。

CPU内部組成部分和工作原理:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

算力方面,CPU可以通過指令實作并行計算提升AI系統的計算性能。

無論是機器學習還是深度學習模型,大多數計算任務在AI算法中主要基于向量和矩陣運算,而CPU通過高效的向量化指令集,可以實作對大規模矩陣乘法、卷積等高性能的計算,能夠在機關時間内完成多個數值運算,進而有效地提高運算效率。

由于很多計算任務如卷積神經網絡(CNN)的卷積運算都具有較強的并行性,CPU可以通過SIMD指令(單指令流多資料流結構)以及多線程技術來加速AI工作負載。

CPU基本架構圖:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

資料來源:Computer Science GCSE GURU

CPU生态體系是硬體和軟體的結合,是産業上下遊互動的産物。

從底層指令系統出發,硬體上通過IP核形成晶片實體電路,并最終用于闆卡、整機廠商等不同領域的整機裝置;軟體上包括Linux核心、編譯器、Java、.NET等基礎開發軟體,以及與指令系統高度适配的作業系統,為搭建完全基于指令系統的應用軟體生态提供平台支撐,最終形成應用于政企、教育、電信等行業的成熟軟硬體體系。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

CPU産業鍊巨頭大多集中在海外,位居産業鍊各個環節核心,對全球CPU行業影響力較大。

行行查 | 行業研究資料庫 資料顯示,在設計環節,英特爾和AMD幾乎壟斷通用型CPU市場;在裝置、材料、EDA/IP等環節國内龍頭與國外龍頭差距較大,國産化率較低;在制造環節,目前隻有台積電和三星有5nm制程生産能力,但均需使用美國裝置;在封測環節,目前中國台灣、中國大陸、美國三分天下。

從全球市場競争格局來看,英特爾仍以70.77%市場佔有率占據全球第一,但受新一代産品Sapphire Rapids釋出推遲影響,市場佔有率相較2021年下降9.94pct。

而AMD在新一代伺服器處理器Genoa的驅動下,市場佔有率進一步提升至19.8%(yoy:+8.10pct)。

此外,基于ARM架構的伺服器CPU廠商AWS和Ampere Computing市場佔有率亦有所增長,2022年AWS/Ampere市場佔有率為3.2/1.5%,較2021年增長1.4/0.4pct。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

從目前國産CPU産業鍊進口替代的視角來看:在設計環節,華為鲲鵬,飛騰等龍頭已跻身世界一流水準;封測環節,通富承接AMD7nmCPU封測,14nm及以下結點的先進制程;裝置、材料、EDA/IP、制造等環節仍與國外龍頭差距較大,目前仍采用“外循環為主+内循環為輔”的模式。

國内CPU産業鍊:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

GPU

GPU直接受益于全球算力需求激增。

根據VerifiedMarketResearch的資料,2021年全球GPU市場規模335億元,2028年全球GPU市場規模有望達到4774億元,22-30年CAGR達33.3%。

IDC資料顯示,中國AI晶片中,GPU 占有90% 以上的市場佔有率,穩居第一,而ASIC、FPGA、NPU等其他非GPU 晶片也在各個行業和領域被越來越多地采用,整體市場佔有率接近10%,預計到2025 年其占比将超過20%。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

GPU 的工作原理和CPU 類似,都是通過執行指令來完成計算任務的。

不同的是,CPU 是通過串行執行指令的方式來完成計算任務的,而GPU 是通過并行執行指令的方式來完成計算任務的。

CPU和GPU對比:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

GPU 的并行計算方式可以同時執行多個任務,大大提高了計算效率和速度。可以對需要同時執行多個計算和記憶體密集型任務的應用進行加速,在AI中主要用于加速訓練和推斷過程。

算力方面,GPU可以通過并行處理能力顯著提升AI應用的處理速度。

英偉達是GPU市場的主導者,全球獨立顯示卡市占率高達80%。其高端GPU如H100,A100和V100等占據了AI算法訓練市場絕大部分的份額。

英偉達在1999年推出首款GeForce256産品,定義了GPU作為圖形渲染晶片的功能。2010年開始英偉達開始專注于AI領域的研發,其TeslaGPU為全球最快的超級計算機提供算力支援,同時推出了首個GPU計算架構“Fermi”。#英偉達#

此後,英偉達保持每半年推出一款新産品,每兩年疊代一次新的晶片架構。從Fermi架構到如今最新的Hopper架構,産品的制程由40nm疊代至4nm,半導體數量從30億增長至800億,FP32算力從1.5TFLOPS提升到60TFLOPS,記憶體帶寬從192.4 GB/s提升到3TB/s。

英偉達Turing TU102 GPU 構架圖:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

美國持續加大對中國高端晶片的出口限制,高速運算相關的GPU晶片國産化程序必然加快。從國産替代方案來看,GPU:寒武紀、壁仞科技、燧原科技、昆侖芯、華為海思等。

國内GPU産業鍊:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

FPGA

FPGA 是一種內建電路晶片,最大特點是現場可程式設計性。

FPGA于1985年由賽靈思創始人之一Ross Freeman發明,并在現有的可程式設計器件(如PAL、GAL、CPLD等)的基礎上進一步發展而來。

FPGA 主要由可程式設計I/O單元、可程式設計邏輯單元、可程式設計布線資源等組成。作為專用內建電路(ASIC)領域中的一種半定制電路,FPGA可以根據使用者的需求通過配套EDA軟體多次重複程式設計配置以實作特定功能。

FPGA結構圖:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

作為AI計算平台使用最為廣泛的加速晶片之一,FPGA具有功耗低、延遲短、靈活性強的特點,被廣泛應用于機器學習、網絡安全、超大規模圖像處理、基因檢測等領域。

由于FPGA具有高度靈活、高速的特點,其并行處理能力可以極大地提高AI算法的計算性能,進而實作高效的推理和訓練等任務。

由于其純硬體的實作方式,FPGA比傳統的CPU和GPU更加靈活,是以越來越多的AI開始采用FPGA進行計算處理。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

全球市場格局方面,海外廠商主導全球FPGA 市場,Xilinx 和Intel 形成雙頭壟斷,國内企業持續加大FPGA 晶片的布局,成長空間巨大。

FPGA 方面,複旦微電(高可靠FPGA 技術領先,率先推出億門級FPGA 和PSoC 晶片,應用領域不斷豐富)和紫光國微(國内特種內建電路行業領先者,産品覆寫500 多個品種,特種領域FPGA 持續更新)、安路科技(國内民用FPGA龍頭)。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

ASIC

ASIC是面向特定的、具體的、相對單一的人工智能應用設計的專用晶片。

2016年,Google釋出TPU晶片(ASIC類),ASIC克服了GPU價格昂貴、功耗高的缺點,ASIC晶片開始逐漸應用于AI領域,成為AI晶片的重要分支。

ASIC從性能、能效、成本均極大的超越了标準晶片,非常适合AI計算場景。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

資料來源:eSilion

根據CSET資料,ASIC晶片在推理領域優勢明顯,其效率和速度約為CPU的100-1000倍,相較于GPU和FPGA具備顯著競争力。

盡管ASIC晶片同樣可以應用于訓練領域(例如TPUv2、v3、v4),但其有望在推理領域率先出現爆品。

ASIC晶片更多應用于推理領域:

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

目前市場上主流ASIC有TPU晶片、NPU晶片、VPU晶片以及BPU晶片,它們分别是由Google、寒武紀、Intel以及地平線設計生産。由于ASIC開發周期長,僅有大廠有資金與實力進行研發。同時,ASIC是全定制晶片,在某些特定場景下運作效率最高,故某些場景下遊市場空間足夠大時,量産ASIC晶片可以實作豐厚的利潤。

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

近年來頭部廠商紛紛切入ASIC領域。英偉達延續GPU路線,22年釋出H100晶片,目前廣泛應用于雲端訓練和推理;AMD利用自身技術積累,将CPU和GPU內建在一起,推出InstinctMI300晶片,預計23年H2上市。

頭部廠商開始切入ASIC領域,Google為AIASIC晶片的先驅,21年推出TPUv4,運算效能大幅提升;英特爾19年收購HabanaLab,22年推出Gaudi2ASIC晶片;IBM、三星等頭部廠商亦紛紛切入ASIC領域。#5月财經新勢力#

算力晶片持續升溫!人工智能高壁壘環節,龍頭強者恒強

資料來源:國信證券

人工智能時代算力晶片産業鍊有望飛速發展,為上下遊産業鍊的帶來新機遇。國内廠商有望抓住本輪AI浪潮加速國産替代,産業鍊各環節市場空間廣闊。

查行業資料,就用行行查!行行查 | 行業研究資料庫

繼續閱讀