随着資料海量增長、算法模型趨向複雜、處理對象異構、計算性能要求高,算力晶片能夠在人工智能的算法和應用上做針對性設計,高效處理人工智能應用中日漸多樣繁雜的計算任務。#算力#
算力晶片是AI伺服器中處理訓練與推理的核心。在模型訓練和推理的過程中需要大量的計算,其本質是在網絡互聯層中将大矩陣輸入資料和權重相乘,是以主要的計算方式為矩陣計算。#人工智能#
在矩陣計算中,每個計算都是獨立于其他計算的,是以可以通過并行計算的方法來對計算過程進行加速。
由于算力晶片相比于CPU擁有更多獨立核心,是以深度學習和神經網絡模型在算力晶片的加持下,采用高度并行的方式進行計算,可更高效地完成計算任務。
從技術架構來看,算力晶片主要分為GPU、FPGA、ASIC三大類。其中,GPU是較為成熟的通用型人工智能晶片,而FPGA和ASIC則是針對人工智能需求特征的半定制和全定制晶片。
IDC資料顯示,2022年加速伺服器市場規模達到67億美元,同比增長24%。其中GPU伺服器依然是主導地位,占據89%的市場佔有率,達到60億美元。同時NPU、ASIC和FPGA等非GPU加速伺服器以同比12%的增速占有了11%的市場佔有率,達到7億美元。
IDC預計,到2025年人工智能晶片市場規模将達726億美元。人工智能晶片搭載率(attach rate)将持續增高,目前每台人工智能伺服器上普遍多配置2個GPU,未來18個月,GPU、ASIC和FPGA的搭載率均會上升。
全球人工智能伺服器GPU、ASIC和FPGA晶片搭載率:
資料來源:IDC
GPU
GPU(GraphicsProcessingUnit):完成圖像運算工作的微處理器。作為一個單獨的子產品,即獨立顯示卡核心或者主機闆內建顯示卡核心。主要用于提供高性能的圖形渲染能力。
IC Insights資料顯示,2015年至2021年間,全球GPU晶片市場規模年均增速超20%,2021年,全球GPU晶片市場規模已超過220億美元,全年出貨總量超過4.6億片。
VerifiedMarketResearch預計,2030年全球GPU市場規模有望達4774億美元:
來源:VerifiedMarketResearch
目前GPU仍占全球AI晶片的主導地位。
英偉達、英特爾、AMD為GPU領域行業巨頭,蘋果、高通等破局者不斷湧入帶來漣漪。
全球GPU晶片産業鍊各代表環節企業:
據JPR測算,英偉達長期占全球獨立顯示卡的市場佔有率近80%,其餘市場佔有率幾乎均被AMD搶占。是以GPU晶片市場英偉達和AMD共同主導。
而英特爾為主要CPU制造商,同時也在PC端GPU具備領先份額。
英偉達的主要競争對手集中在GPU産業鍊的設計環節。
英偉達(NVIDIA)是GPU的龍頭企業,針對高性能計算,英偉達從2016年開始,陸續推出了Pascal、Volta、Turing、Ampere、Hopper五個平台架構。其GPGPU去掉或減弱了GPU的圖形顯示部分能力,将其餘部分全部投入與圖形處理無關的通用計算。
NVIDIA GA100架構(基于GA100的A100隻有108個SM):
資料來源:英偉達
英偉達從A100到H100為AI訓練和推理帶來曆史性變革,成就加速計算的數量級飛躍。
A100将HPC的運作速度提升至9倍:
英偉達以超異構創新建構面向大規模AI計算的系統性競争優勢。
面向AI時代大規模并行計算,進行了全棧系統的優化。英偉達晶片互聯通信技術NVLink性能快速疊代,GPU +Bluefield DPU+Grace CPU的結合開創性地實作了晶片系統間的高速通信互聯。
随着近年來美國持續加大對中國高端晶片的出口限制,高速運算相關的GPU、CPU等晶片國産化程序必然加快。從國産替代方案來看,景嘉微、海光資訊、好利科技、壁仞科技等廠商有望受益。
國内GPU産業鍊情況:
資料來源:科創闆日報
FPGA
現場可程式設計門陣列(FPGA)指在矽片上預先設計,同時具有可程式設計特性的內建電路,開發者能夠根據産品需求進行設計配置。
FPGA的基本結構:
FPGA技術目前具備較高的技術壁壘,但受益于AI技術持續擴充,行業需求具備明顯确定性,将有望吸引更多競争者入局,也将會對GPU的潛在市場産生沖擊。
FPGA适合需求較小的定制化場景:
海外廠商主導全球FPGA 市場,賽靈思和英特爾形成雙頭壟斷。
國内FPGA晶片與國外差距較大,在28nm工藝制程領域,2011年兩大國際FPGA巨頭賽靈思和Altera率先釋出了28nm工藝制程FPGA,并逐漸開始銷售,另外兩家美國FPGA公司Lattice和Actel也于2019年推出28nm工藝制程FPGA,目前28nm工藝制程FPGA的主要市場佔有率由上述4家美國公司占據。
本土廠商市占率較小,國内FPGA廠商以複旦微電、紫光同創、安路科技等為代表。
國内紫光同創于2020年初釋出了28nm工藝制程的千萬門級FPGA産品,SerDes傳輸速率6.6Gbps;安路科技于2020年推出了PHOENIX系列産品,SerDes傳輸速率16Gbps。
複旦微電自2004年開始進行FPGA的研發,曾陸續推出百萬門級FPGA和千萬門級FPGA,2018年第二季度率先推出28nm工藝制程的億門級FPGA産品,SerDes傳輸速率達到最高13.1Gbps,并在2019年正式銷售。
ASIC
ASIC适應定制化高需求使用場景,計算能力和效率可根據算法需要進行定制。專用內建電路(ASIC)指根據使用者特定的要求和特定電子系統的需要而制造的內建電路,設計完成後內建電路的結構即固定。
ASIC适用于對于晶片高需求且定制化程度較高的應用場景,如先前的礦機晶片和如今火熱的自動駕駛晶片。
ASIC在吞吐量、延遲和功耗單個方面都是最優秀的。
FPGA、GPU、ASIC晶片在性能上的對比:
資料來源:複旦微電
ASIC複雜的設計流程:
目前市場上主流ASIC有TPU晶片、NPU晶片、VPU晶片以及BPU晶片,它們分别是由Google、寒武紀、Intel以及地平線設計生産。
由于ASIC開發周期長,僅有大廠有資金與實力進行研發。同時,ASIC是全定制晶片,在某些特定場景下運作效率最高,故某些場景下遊市場空間足夠大時,量産ASIC晶片可以實作豐厚的利潤。
目前,頭部廠商開始切入ASIC領域,Google為AIASIC晶片的先驅,21年推出TPUv4,運算效能大幅提升;英特爾19年收購HabanaLab,22年推出Gaudi2ASIC晶片;IBM、三星等頭部廠商亦紛紛切入ASIC領域。#5月财經新勢力#
國内廠商中,寒武紀NPU是中科院計算所團隊研發,采用“資料驅動并行計算”的架構,可應用于手機、安防、可穿戴裝置等終端晶片
地平線BPU晶片是地平線機器人研發,該晶片未來會直接應用于自身的主要産品中,包括:智能駕駛、智能生活和智能城市。
比特大陸釋出的BM1680專用晶片适用于CNN/RNN等深度學習網絡模型的預測和訓練計算加速。
關注樂晴智庫,洞悉産業格局!