天天看點

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

作者:樂晴行業觀察

随着資料海量增長、算法模型趨向複雜、處理對象異構、計算性能要求高,算力晶片能夠在人工智能的算法和應用上做針對性設計,高效處理人工智能應用中日漸多樣繁雜的計算任務。#算力#

算力晶片是AI伺服器中處理訓練與推理的核心。在模型訓練和推理的過程中需要大量的計算,其本質是在網絡互聯層中将大矩陣輸入資料和權重相乘,是以主要的計算方式為矩陣計算。#人工智能#

在矩陣計算中,每個計算都是獨立于其他計算的,是以可以通過并行計算的方法來對計算過程進行加速。

由于算力晶片相比于CPU擁有更多獨立核心,是以深度學習和神經網絡模型在算力晶片的加持下,采用高度并行的方式進行計算,可更高效地完成計算任務。

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

從技術架構來看,算力晶片主要分為GPU、FPGA、ASIC三大類。其中,GPU是較為成熟的通用型人工智能晶片,而FPGA和ASIC則是針對人工智能需求特征的半定制和全定制晶片。

IDC資料顯示,2022年加速伺服器市場規模達到67億美元,同比增長24%。其中GPU伺服器依然是主導地位,占據89%的市場佔有率,達到60億美元。同時NPU、ASIC和FPGA等非GPU加速伺服器以同比12%的增速占有了11%的市場佔有率,達到7億美元。

IDC預計,到2025年人工智能晶片市場規模将達726億美元。人工智能晶片搭載率(attach rate)将持續增高,目前每台人工智能伺服器上普遍多配置2個GPU,未來18個月,GPU、ASIC和FPGA的搭載率均會上升。

全球人工智能伺服器GPU、ASIC和FPGA晶片搭載率:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

資料來源:IDC

GPU

GPU(GraphicsProcessingUnit):完成圖像運算工作的微處理器。作為一個單獨的子產品,即獨立顯示卡核心或者主機闆內建顯示卡核心。主要用于提供高性能的圖形渲染能力。

IC Insights資料顯示,2015年至2021年間,全球GPU晶片市場規模年均增速超20%,2021年,全球GPU晶片市場規模已超過220億美元,全年出貨總量超過4.6億片。

VerifiedMarketResearch預計,2030年全球GPU市場規模有望達4774億美元:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

來源:VerifiedMarketResearch

目前GPU仍占全球AI晶片的主導地位。

英偉達、英特爾、AMD為GPU領域行業巨頭,蘋果、高通等破局者不斷湧入帶來漣漪。

全球GPU晶片産業鍊各代表環節企業:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

據JPR測算,英偉達長期占全球獨立顯示卡的市場佔有率近80%,其餘市場佔有率幾乎均被AMD搶占。是以GPU晶片市場英偉達和AMD共同主導。

而英特爾為主要CPU制造商,同時也在PC端GPU具備領先份額。

英偉達的主要競争對手集中在GPU産業鍊的設計環節。

英偉達(NVIDIA)是GPU的龍頭企業,針對高性能計算,英偉達從2016年開始,陸續推出了Pascal、Volta、Turing、Ampere、Hopper五個平台架構。其GPGPU去掉或減弱了GPU的圖形顯示部分能力,将其餘部分全部投入與圖形處理無關的通用計算。

NVIDIA GA100架構(基于GA100的A100隻有108個SM):

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

資料來源:英偉達

英偉達從A100到H100為AI訓練和推理帶來曆史性變革,成就加速計算的數量級飛躍。

A100将HPC的運作速度提升至9倍:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

英偉達以超異構創新建構面向大規模AI計算的系統性競争優勢。

面向AI時代大規模并行計算,進行了全棧系統的優化。英偉達晶片互聯通信技術NVLink性能快速疊代,GPU +Bluefield DPU+Grace CPU的結合開創性地實作了晶片系統間的高速通信互聯。

随着近年來美國持續加大對中國高端晶片的出口限制,高速運算相關的GPU、CPU等晶片國産化程序必然加快。從國産替代方案來看,景嘉微、海光資訊、好利科技、壁仞科技等廠商有望受益。

國内GPU産業鍊情況:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

資料來源:科創闆日報

FPGA

現場可程式設計門陣列(FPGA)指在矽片上預先設計,同時具有可程式設計特性的內建電路,開發者能夠根據産品需求進行設計配置。

FPGA的基本結構:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

FPGA技術目前具備較高的技術壁壘,但受益于AI技術持續擴充,行業需求具備明顯确定性,将有望吸引更多競争者入局,也将會對GPU的潛在市場産生沖擊。

FPGA适合需求較小的定制化場景:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

海外廠商主導全球FPGA 市場,賽靈思和英特爾形成雙頭壟斷。

國内FPGA晶片與國外差距較大,在28nm工藝制程領域,2011年兩大國際FPGA巨頭賽靈思和Altera率先釋出了28nm工藝制程FPGA,并逐漸開始銷售,另外兩家美國FPGA公司Lattice和Actel也于2019年推出28nm工藝制程FPGA,目前28nm工藝制程FPGA的主要市場佔有率由上述4家美國公司占據。

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

本土廠商市占率較小,國内FPGA廠商以複旦微電、紫光同創、安路科技等為代表。

國内紫光同創于2020年初釋出了28nm工藝制程的千萬門級FPGA産品,SerDes傳輸速率6.6Gbps;安路科技于2020年推出了PHOENIX系列産品,SerDes傳輸速率16Gbps。

複旦微電自2004年開始進行FPGA的研發,曾陸續推出百萬門級FPGA和千萬門級FPGA,2018年第二季度率先推出28nm工藝制程的億門級FPGA産品,SerDes傳輸速率達到最高13.1Gbps,并在2019年正式銷售。

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

ASIC

ASIC适應定制化高需求使用場景,計算能力和效率可根據算法需要進行定制。專用內建電路(ASIC)指根據使用者特定的要求和特定電子系統的需要而制造的內建電路,設計完成後內建電路的結構即固定。

ASIC适用于對于晶片高需求且定制化程度較高的應用場景,如先前的礦機晶片和如今火熱的自動駕駛晶片。

ASIC在吞吐量、延遲和功耗單個方面都是最優秀的。

FPGA、GPU、ASIC晶片在性能上的對比:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

資料來源:複旦微電

ASIC複雜的設計流程:

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

目前市場上主流ASIC有TPU晶片、NPU晶片、VPU晶片以及BPU晶片,它們分别是由Google、寒武紀、Intel以及地平線設計生産。

由于ASIC開發周期長,僅有大廠有資金與實力進行研發。同時,ASIC是全定制晶片,在某些特定場景下運作效率最高,故某些場景下遊市場空間足夠大時,量産ASIC晶片可以實作豐厚的利潤。

目前,頭部廠商開始切入ASIC領域,Google為AIASIC晶片的先驅,21年推出TPUv4,運算效能大幅提升;英特爾19年收購HabanaLab,22年推出Gaudi2ASIC晶片;IBM、三星等頭部廠商亦紛紛切入ASIC領域。#5月财經新勢力#

算力晶片需求井噴!AI伺服器核心環節,龍頭強者恒強

國内廠商中,寒武紀NPU是中科院計算所團隊研發,采用“資料驅動并行計算”的架構,可應用于手機、安防、可穿戴裝置等終端晶片

地平線BPU晶片是地平線機器人研發,該晶片未來會直接應用于自身的主要産品中,包括:智能駕駛、智能生活和智能城市。

比特大陸釋出的BM1680專用晶片适用于CNN/RNN等深度學習網絡模型的預測和訓練計算加速。

關注樂晴智庫,洞悉産業格局!