天天看點

一文看懂國内外AI晶片産品對比

作者:卓乎知芯

一、AI晶片産品分類

AI晶片也被稱為AI加速器或計算卡,是專門用于處理人工智能訓練和推理任務的專用硬體。目前,主要包括GPU、FPGA、ASIC等(其他非計算任務仍由CPU負責)。這些晶片具備高度并行性和能夠實作低功耗高效計算的特點。随着AI應用的廣泛普及和對算力的不斷增加需求,AI晶片的需求有望成為首要擴張的領域。

一文看懂國内外AI晶片産品對比

資料顯示,截至2022年底,大陸算力總規模達到180百億億次浮點運算/秒,存力總規模超過1000EB,即1萬億GB。算力産業的規模正在以驚人的速度增長。根據IDC預測,預計到2026年,大陸浮點運算次數将達到1271.4 EFLOPS,在2022-2026年期間,年均複合增長率預計将達到52.3%。在這種背景下,IDC預測,未來18個月内,全球範圍内人工智能伺服器上GPU、ASIC和FPGA的使用率都将上升。預計到2025年,人工智能晶片市場規模将達到726億美元。

CPU:在AI計算中,CPU是基礎,負責控制和協調所有的計算操作,是整個計算過程的控制核心。它承擔着讀取和準備資料的任務,并将資料傳輸到GPU等協處理器進行計算,最終再輸出計算結果。CPU在深度學習中具有出色的邏輯控制能力,尤其适用于推理/預測任務。AI産品在推理過程中,需要實時對大量經過訓練的模型進行推理/預測操作,而這種操作通常需要高效的邏輯控制能力和低延遲的響應速度,這正是CPU的優勢所在。

一文看懂國内外AI晶片産品對比

圖源:中泰證券2023研報

GPU:最初GPU是為了滿足計算機遊戲等圖形處理需求而開發的,但由于其出色的并行計算和大規模資料處理能力,逐漸被廣泛應用于通用計算領域。目前,GPU已經占據了AI晶片市場的主要份額。根據應用場景和處理任務的不同,GPU形成了兩個分支:傳統GPU主要用于圖形圖像處理,内置了一系列專用運算子產品,如視訊編解碼加速引擎、2D加速引擎和圖像渲染等。GPGPU(通用計算圖形處理器),為了更好地支援通用計算,GPGPU減弱了GPU的圖形顯示部分能力,并将其餘部分全部投入到通用計算中。同時,GPGPU增加了專用的向量、張量和矩陣運算指令,提升了浮點運算的精度和性能。這使得GPU成為人工智能和專業計算等加速應用的理想選擇。

FPGA:(現場可程式設計邏輯門陣列)是在可程式設計陣列邏輯(PAL)、通用陣列邏輯(GAL)等可程式設計器件的基礎上進一步發展而來的。FPGA最顯著的特點在于其現場可程式設計性,與CPU、GPU或ASIC等晶片不同,這些晶片的功能在制造完成後就被固定,無法進行硬體功能的更改。而FPGA在制造完成後仍然可以使用配套的軟體對晶片進行功能配置,将晶片上的空白子產品轉化為具備特定功能的子產品,進而滿足使用者的需求。FPGA具有可程式設計性、高并行性、低延遲和低功耗等特點,這使得它在AI推斷領域具有巨大的潛力。目前,FPGA廣泛應用于線上資料進行中心和軍工機關等領域。

ASIC:(專用內建電路)是一種專門為滿足特定使用者需求和特定電子系統設計和制造的內建電路。ASIC在性能、能效和成本等方面超越了标準晶片,具有較高的能效比和算力水準,非常适合AI計算場景,成為許多AI初創公司開發的目标産品。然而,ASIC在研發和制造方面的一次性成本較高。設計和驗證ASIC晶片需要大量的工程資源和時間,進而導緻研發成本的增加。但一旦ASIC量産,後續的平均成本會顯著降低,具備批量生産的成本優勢。目前,ASIC主要應用于推斷場景,其中在終端推斷市場佔有率最大,而在雲端推斷市場增長較快。

二、國内外AI晶片産品對比

目前全球伺服器CPU市場被Intel和AMD所壟斷,國内CPU廠商在性能方面仍與國際領先水準存在差距。根據Counterpoint的資料顯示,2022年全球CPU市場中,Intel以70.77%的市場佔有率位居第一,AMD以19.84%的份額排名第二,而其他廠商僅占據9.39%的市場佔有率。整體上市場被兩大廠商所主導。目前國内的CPU廠商包括海光、海思、飛騰、龍芯、申威等。盡管國内CPU廠商的伺服器産品性能已接近Intel中端産品水準,但從整體上看,國内在工藝制程、運算速度(主頻)以及多任務處理(核心與線程數)等方面仍落後于國際先進水準。

一文看懂國内外AI晶片産品對比

圖源:中泰證券2023研報

目前全球GPU晶片市場同樣被海外廠商壟斷,由NVIDIA、Intel和AMD三家巨頭主導,其中NVIDIA憑借其CUDA生态系統在人工智能和高性能計算領域占據絕對主導地位。在國内市場中,景嘉微一直緻力于圖形渲染GPU領域,而天數智芯、壁仞科技、登臨科技等初創企業則專注于人工智能和高性能計算的通用GPU(GPGPU)領域,并且正在加快發展步伐。

就圖形渲染GPU而言,國内廠商與國外龍頭廠商之間的差距正在不斷縮小。芯動科技的“風華2号”GPU采用了5納米制程,與NVIDIA最新一代産品RTX40系列相媲美,實作了國産圖形渲染GPU的突破。景嘉微在工藝制程、核心頻率和浮點性能等方面雖然落後于NVIDIA同代産品,但差距正在逐漸縮小。

一文看懂國内外AI晶片産品對比

圖源:中泰證券2023研報

在GPGPU方面,國内廠商與NVIDIA之間仍存在較大差距。在制程方面,NVIDIA已經率先推出了4納米制程,而國内廠商主要集中在7納米制程。在算力方面,國内廠商大多不支援雙精度(FP64)計算,但在單精度(FP32)和定點計算(INT8)方面與國外中端産品持平,天數智芯和壁仞科技的人工智能晶片産品在單精度性能上超過了NVIDIA的A100。在接口方面,壁仞科技和NVIDIA率先采用了PCIe 5.0,而其他廠商多數還在使用PCIe 4.0。在生态方面,國内企業多采用OpenCL進行自主生态建設,與NVIDIA成熟的CUDA生态相比,仍存在明顯差距。

一文看懂國内外AI晶片産品對比

圖源:中泰證券2023研報

FPGA全球市場呈現出一種“兩大兩小”的格局,其中Altera(阿爾特拉,2015年被英特爾收購)和Xilinx(賽靈思)兩家公司的市場佔有率總計超過80%,而Lattice(萊迪思)和Microsemi(美高森美)的市場佔有率總計超過10%。國産方面,安路科技、紫光同創等國内廠商處于國際中端水準,但仍需要進一步突破。在工藝制程方面,目前國内廠商的先進制程主要集中在28納米,落後于國際水準的16納米。而在等效邏輯單元(LUT)數量方面,國内廠商的旗艦産品大約為20萬個,僅相當于Xilinx高端産品的25%左右。

一文看懂國内外AI晶片産品對比

ASIC與CPU、GPU和FPGA有着不同的特點,目前全球ASIC市場尚未形成明顯的頭部廠商,而國内ASIC廠商正在迅速發展。通過産品對比可以發現,目前國内廠商主要采用與國外ASIC廠商相同的7納米工藝制程。在算力方面,海思的昇騰910在BF16浮點算力和INT8定點算力方面超越了Google最新一代産品TPUv4,而遂原科技和寒武紀的産品在整體性能上也可以與Google相媲美。

三、國内細分領域代表性企業

龍芯中科:國産CPU設計标杆

龍芯中科于2008年由中科院和北京市政府共同牽頭出資成立,2022年6月,在科創闆上市。龍芯中科是一家專注于處理器(CPU)及配套晶片的研發、銷售和服務的公司,同時也是國内唯一自主掌握高性能CPUIP知識産權、具備系列化CPUIP核授權條件的企業。主要産品包括龍芯1号、龍芯2号和龍芯3号等處理器晶片系列,以及與之配套的橋接晶片等。這些産品在電子政務、能源、交通、金融、電信、教育等行業領域得到廣泛應用。

龍芯中科堅持自主研發指令系統、IP核等核心技術。掌握了指令系統、處理器核微結構、GPU以及各種接口IP等核心晶片技術,并進行自主研發,擁有大量的自主知識産權,已獲得400多項專利。今年4月,龍芯推出了2023款HPC CPU:3D5000。這款處理器擁有32個核心,主頻高達2 GHz,熱設計功耗(TDP)為300瓦特。據稱,該處理器的性能比典型的Arm晶片快了4倍。為了實作這一性能提升,龍芯采用了兩個現有的3C5000晶片的小晶片封裝方式。這款處理器主要面向國内伺服器細分市場和高性能計算(HPC)客戶。

一文看懂國内外AI晶片産品對比

景嘉微:國産GPU領軍企業

景嘉微成立于2006年,2016年3月公司在深交所創業闆上市。公司專注于高可靠性電子産品的研發、生産和銷售,涵蓋圖形顯控、小型專用化雷達和晶片領域等産品。其中,圖形顯控是公司的核心業務和傳統優勢,而小型專用化雷達和晶片則是公司未來發展的重點領域。

在GPU研發方面,景嘉微公司的進展平穩,推出的新産品能夠滿足人工智能計算的需求。公司從JM5400系列開始,不斷研發更先進且适用範圍更廣的GPU晶片。2014年,公司推出了JM5400,核心頻率為550MHz;2018年,推出了JM7200系列,核心頻率為1300MHz;2021年,推出了JM9系列,核心頻率達到1.5GHz。

根據公司2022年中期報告顯示,2022年5月公司成功研發了JM9系列的第二款圖形處理晶片。該晶片能夠滿足地理資訊系統、媒體處理、CAD輔助設計、遊戲、虛拟化等對高性能顯示和人工智能計算需求的廣泛應用。它可用于桌上型電腦、筆記本電腦、一體機、伺服器、工控機、自助終端等裝置。這進一步證明了景嘉微公司在GPU領域的技術實力和産品創新能力。

一文看懂國内外AI晶片産品對比

寒武紀:國産AI晶片領先者

寒武紀是AI晶片領域的獨角獸公司,成立于2016年,2020年7月在科創闆上市。公司專注于人工智能晶片産品的研發和技術創新,産品廣泛應用于消費電子、資料中心、雲計算等多個領域。作為AI晶片領域的獨角獸,寒武紀已取得了顯著成就:采用公司終端智能處理器IP的終端裝置出貨量超過億台;雲端智能晶片及加速卡已成功應用于國内主流伺服器廠商的産品,并實作了大規模量産;釋出邊緣智能晶片及加速卡。

一文看懂國内外AI晶片産品對比

人工智能在各種應用場景中的發展,從雲端向邊緣端擴充甚至下沉到終端裝置,都離不開高效的智能晶片的支援。為此,寒武紀面向雲端、邊緣端和終端推出了三個系列不同品類的通用型智能晶片和處理器産品。其中,終端智能處理器IP适用于終端裝置,雲端智能晶片及加速卡适用于雲計算場景,而邊緣智能晶片及加速卡則專注于邊緣計算應用。這種産品布局意味着寒武紀能夠全面滿足各種場景對智能晶片的需求。

繼續閱讀