随着資料海量增長、算法模型趨向複雜、處理對象異構、計算性能要求高，算力晶片能夠在人工智能的算法和應用上做針對性設計，高效處理人工智能應用中日漸多樣繁雜的計算任務。#算力#

算力晶片是AI伺服器中處理訓練與推理的核心。在模型訓練和推理的過程中需要大量的計算，其本質是在網絡互聯層中将大矩陣輸入資料和權重相乘，是以主要的計算方式為矩陣計算。#人工智能#

在矩陣計算中，每個計算都是獨立于其他計算的，是以可以通過并行計算的方法來對計算過程進行加速。

由于算力晶片相比于CPU擁有更多獨立核心，是以深度學習和神經網絡模型在算力晶片的加持下，采用高度并行的方式進行計算，可更高效地完成計算任務。

從技術架構來看，算力晶片主要分為GPU、FPGA、ASIC三大類。其中，GPU是較為成熟的通用型人工智能晶片，而FPGA和ASIC則是針對人工智能需求特征的半定制和全定制晶片。

IDC資料顯示，2022年加速伺服器市場規模達到67億美元，同比增長24%。其中GPU伺服器依然是主導地位，占據89%的市場佔有率，達到60億美元。同時NPU、ASIC和FPGA等非GPU加速伺服器以同比12%的增速占有了11%的市場佔有率，達到7億美元。

IDC預計，到2025年人工智能晶片市場規模将達726億美元。人工智能晶片搭載率（attach rate）将持續增高，目前每台人工智能伺服器上普遍多配置2個GPU，未來18個月，GPU、ASIC和FPGA的搭載率均會上升。

全球人工智能伺服器GPU、ASIC和FPGA晶片搭載率:

資料來源：IDC

GPU

GPU（GraphicsProcessingUnit）：完成圖像運算工作的微處理器。作為一個單獨的子產品，即獨立顯示卡核心或者主機闆內建顯示卡核心。主要用于提供高性能的圖形渲染能力。

IC Insights資料顯示，2015年至2021年間，全球GPU晶片市場規模年均增速超20%，2021年，全球GPU晶片市場規模已超過220億美元，全年出貨總量超過4.6億片。

VerifiedMarketResearch預計，2030年全球GPU市場規模有望達4774億美元:

來源：VerifiedMarketResearch

目前GPU仍占全球AI晶片的主導地位。

英偉達、英特爾、AMD為GPU領域行業巨頭，蘋果、高通等破局者不斷湧入帶來漣漪。

全球GPU晶片産業鍊各代表環節企業：

據JPR測算,英偉達長期占全球獨立顯示卡的市場佔有率近80%，其餘市場佔有率幾乎均被AMD搶占。是以GPU晶片市場英偉達和AMD共同主導。

而英特爾為主要CPU制造商，同時也在PC端GPU具備領先份額。

英偉達的主要競争對手集中在GPU産業鍊的設計環節。

英偉達（NVIDIA）是GPU的龍頭企業，針對高性能計算，英偉達從2016年開始，陸續推出了Pascal、Volta、Turing、Ampere、Hopper五個平台架構。其GPGPU去掉或減弱了GPU的圖形顯示部分能力，将其餘部分全部投入與圖形處理無關的通用計算。

NVIDIA GA100架構（基于GA100的A100隻有108個SM）：

資料來源：英偉達

英偉達從A100到H100為AI訓練和推理帶來曆史性變革，成就加速計算的數量級飛躍。

A100将HPC的運作速度提升至9倍：

英偉達以超異構創新建構面向大規模AI計算的系統性競争優勢。

面向AI時代大規模并行計算，進行了全棧系統的優化。英偉達晶片互聯通信技術NVLink性能快速疊代，GPU +Bluefield DPU+Grace CPU的結合開創性地實作了晶片系統間的高速通信互聯。

随着近年來美國持續加大對中國高端晶片的出口限制，高速運算相關的GPU、CPU等晶片國産化程序必然加快。從國産替代方案來看，景嘉微、海光資訊、好利科技、壁仞科技等廠商有望受益。

國内GPU産業鍊情況：

資料來源：科創闆日報

FPGA

現場可程式設計門陣列（FPGA）指在矽片上預先設計，同時具有可程式設計特性的內建電路，開發者能夠根據産品需求進行設計配置。

FPGA的基本結構：

FPGA技術目前具備較高的技術壁壘，但受益于AI技術持續擴充，行業需求具備明顯确定性，将有望吸引更多競争者入局，也将會對GPU的潛在市場産生沖擊。

FPGA适合需求較小的定制化場景：

海外廠商主導全球FPGA 市場，賽靈思和英特爾形成雙頭壟斷。

國内FPGA晶片與國外差距較大，在28nm工藝制程領域，2011年兩大國際FPGA巨頭賽靈思和Altera率先釋出了28nm工藝制程FPGA，并逐漸開始銷售，另外兩家美國FPGA公司Lattice和Actel也于2019年推出28nm工藝制程FPGA，目前28nm工藝制程FPGA的主要市場佔有率由上述4家美國公司占據。

本土廠商市占率較小，國内FPGA廠商以複旦微電、紫光同創、安路科技等為代表。

國内紫光同創于2020年初釋出了28nm工藝制程的千萬門級FPGA産品，SerDes傳輸速率6.6Gbps；安路科技于2020年推出了PHOENIX系列産品，SerDes傳輸速率16Gbps。

複旦微電自2004年開始進行FPGA的研發，曾陸續推出百萬門級FPGA和千萬門級FPGA，2018年第二季度率先推出28nm工藝制程的億門級FPGA産品，SerDes傳輸速率達到最高13.1Gbps，并在2019年正式銷售。

ASIC

ASIC适應定制化高需求使用場景，計算能力和效率可根據算法需要進行定制。專用內建電路（ASIC）指根據使用者特定的要求和特定電子系統的需要而制造的內建電路，設計完成後內建電路的結構即固定。

ASIC适用于對于晶片高需求且定制化程度較高的應用場景，如先前的礦機晶片和如今火熱的自動駕駛晶片。

ASIC在吞吐量、延遲和功耗單個方面都是最優秀的。

FPGA、GPU、ASIC晶片在性能上的對比：

資料來源：複旦微電

ASIC複雜的設計流程：

目前市場上主流ASIC有TPU晶片、NPU晶片、VPU晶片以及BPU晶片，它們分别是由Google、寒武紀、Intel以及地平線設計生産。

由于ASIC開發周期長，僅有大廠有資金與實力進行研發。同時，ASIC是全定制晶片，在某些特定場景下運作效率最高，故某些場景下遊市場空間足夠大時，量産ASIC晶片可以實作豐厚的利潤。

目前，頭部廠商開始切入ASIC領域，Google為AIASIC晶片的先驅，21年推出TPUv4，運算效能大幅提升；英特爾19年收購HabanaLab，22年推出Gaudi2ASIC晶片；IBM、三星等頭部廠商亦紛紛切入ASIC領域。#5月财經新勢力#

國内廠商中，寒武紀NPU是中科院計算所團隊研發，采用“資料驅動并行計算”的架構，可應用于手機、安防、可穿戴裝置等終端晶片

地平線BPU晶片是地平線機器人研發，該晶片未來會直接應用于自身的主要産品中，包括：智能駕駛、智能生活和智能城市。

比特大陸釋出的BM1680專用晶片适用于CNN/RNN等深度學習網絡模型的預測和訓練計算加速。

關注樂晴智庫，洞悉産業格局！

算力晶片需求井噴！AI伺服器核心環節，龍頭強者恒強

GPU

FPGA

ASIC