天天看點

技經觀察丨淺析人工智能晶片發展的技術方向

作者:全球技術地圖
技經觀察丨淺析人工智能晶片發展的技術方向

随着類ChatGPT人工智能技術的快速發展,AI大模型作為重要的技術方向已經取得顯著進展,應用場景不斷拓展和滲透,全球科技企業紛紛入場角逐。然而,由此帶來的算力瓶頸問題正越來越受到關注。AI大模型高算力需求正催生AI晶片的快速疊代,“無晶片,不AI”,以AI晶片為載體實作的算力正成為人工智能發展水準的重要衡量标準。

一、AI晶片誕生和發展的背景

自1956年美國達特茅斯學院首次提出人工智能(AI)的概念以來,AI技術不斷獲得突破和快速發展,對算力的需求也不斷增加。為了滿足這種需求,AI晶片不斷疊代更新,目前已成為算力提升的核心基礎硬體。

2006年以前,AI算法尚未出現突破性進展,且AI的訓練資料主要以小資料為主。是以學術界和産業界對AI的算力需求主要由CPU提供,在這個階段AI晶片發展較慢。

2006年到2016年期間,AI算法在深度學習上獲得突破,同時大資料、雲計算等技術在這期間高速發展,進一步促進了AI在“大資料+深度學習”模式上的快速發展,随之而來的是AI性能的提升越來越依賴于計算能力的大小。研究人員發現,相比于CPU,GPU具備并行計算特性,是以在深度學習等人工智能先進算法所需的“暴力計算”場景中更為高效。通過充分發揮GPU的優勢,人工智能算法的計算效率可以大幅提升,這促使研究人員廣泛采用GPU進行人工智能領域的研究和應用。

2016年以後,随着AI技術的發展和商用化,AI晶片進入大發展階段。2016年,美國谷歌旗下DeepMind團隊開發的AI系統AlphaGo戰勝南韓棋手李世石,引發全球AI熱潮。此後,AI領域對于算力的需求不斷增加。但GPU的高功耗和高價格限制了其在不同場景中的應用。為應對上述挑戰,研究人員開始緻力于開發定制化的AI晶片,以實作在加速AI算法運算的同時降低功耗和成本。自此,大量初創企業和傳統網際網路巨頭紛紛湧入AI晶片領域,推動了專用AI晶片的快速發展。2022年11月,美國OpenAI公司推出AI大模型ChatGPT,引發全球AI大模型發展浪潮,這一趨勢進一步加大了AI領域對算力的需求,推動了AI晶片的投資和發展。

二、AI晶片發展的技術方向

廣義而言,AI晶片指的是專門用于處理人工智能應用中大量計算任務的子產品,即面向人工智能領域的晶片均被稱為AI晶片。狹義的AI晶片指的是針對人工智能算法做了特殊加速設計的晶片[1,2]。從技術架構來看,AI晶片主要分為圖形處理器(GPU)、現場可程式設計門陣列(FPGA)、專用內建電路(ASIC)、類腦晶片四大類。其中,GPU為通用型人工智能晶片,FPGA和ASIC是針對AI需求特征的半定制和全定制晶片,類腦晶片則是一種模仿人腦神經系統結構和功能的處理器。

(一)圖形處理器(GPU)。GPU最初是專門用來做圖像處理的,如圖像渲染、特效制作等,後因其優秀的矩陣計算能力和并發計算的架構,被廣泛運用于AI領域。目前,GPU已成為AI領域最為成熟和廣泛應用的通用型晶片,在資料中心、超級計算機等大型計算設施中備受青睐,在AI晶片市場中占據主導地位。

在全球GPU廠商中,英偉達GPU技術一直處于領先水準,其融合了統一計算裝置架構CUDA,建構起軟硬體高性能計算的生态壁壘。2022年3月,英偉達在GPU技術大會(GPU Technology Conference)上釋出了基于新一代Hopper架構的高性能GPU晶片H100,其配備第四代Tensor Core和Transformer引擎,與上一代産品相比,H100的綜合技術創新可以将AI大型語言模型的速度提高30倍。

(二)現場可程式設計門陣列(FPGA)。FPGA是一種靈活可程式設計的硬體平台,具備較高的計算性能和可定制性等優點,能夠對AI算法進行加速和優化。在不斷疊代的AI算法場景下,FPGA憑借其靈活性、低功耗和低延時的技術優點,在AI推理應用中表現出色。2022年11月,英特爾釋出基于第二代英特爾Hyperflex FPGA架構的Agilex FPGA晶片,其中整合引入了AI張量子產品的增強型數字信号處理(DSP)功能子產品,能夠更好支援AI/圖像/視訊處理以及可執行複數計算的DSP密集型應用。

(三)專用內建電路(ASIC)。ASIC是針對使用者對特定電子系統的需求而設計的專用內建電路,其計算能力和計算效率可根據算法需要進行定制,是固定算法最優化設計的産物。2016年,谷歌釋出ASIC晶片TPU v1,主要應用于AI推理過程。自此,ASIC克服了GPU價格昂貴、功耗高的缺點,開始逐漸應用于AI領域,成為AI晶片的重要分支。2017年5月,谷歌釋出TPU v2,相比于TPU v1,TPU v2最大的特色在于它既可以用于AI訓練,又可以用于AI推理。2018年5月,谷歌釋出TPU v3,可實作超過100PFLOPS的處理能力,幾乎是TPU v2的8倍。2022年5月,谷歌又推出TPU v4,相比于英偉達A100晶片,處理速度最高快1.7倍,節能效率提高1.9倍。

2022年3月,中國寒武紀公司推出訓推一體AI加速卡MLU370-X8,搭載雙晶片四芯粒思元370,內建寒武紀MLU-Link多芯互聯技術,可應用于YOLOv3、Transformer等AI訓練任務中,每張加速卡可獲得200GB/s的通訊吞吐性能,是PCIe4.0帶寬的3.1倍,可高效執行多芯多卡AI訓練和分布式AI推理任務。

(四)類腦晶片。類腦晶片是結合微電子技術和新型神經形态器件,模仿人腦神經系統進行設計的AI處理器,旨在突破“馮·諾依曼瓶頸”,實作超低功耗和并行計算能力。類腦晶片被認為是後摩爾時代重要的發展方向之一,可能成為未來智能計算的突破口。

2017年,清華大學研發出第二代異構融合類腦晶片“天機芯”,其具有高速度、高性能、低功耗的特點,制程為28納米。相比于當時世界先進的IBM的TrueNorth晶片,其功能更全、靈活性和擴充性更好,密度提升20%,速度提高至少10倍,帶寬提高至少100倍。2019年,基于“天機芯”研究成果的論文《面向人工通用智能的異構天機晶片架構》(Towards Artificial General Intelligence with Hybrid Tianjic Chip Architecture)作為封面文章登上《自然》(Nature)雜志。2021年4月,英特爾釋出第二代神經拟态晶片Loihi 2,其內建神經元達到100萬個,是上一代的7.8倍,處理速度提高10倍。

三、AI晶片的發展趨勢

晶片的發展和更新換代一直依賴于工藝、架構和應用三個方面的推動。在應用方面,随着AI技術的深入發展和廣泛應用,不同的AI應用場景正推動AI晶片向專業化方向發展,以滿足特定場景對性能、功耗和成本的需求。在技術方面,随着拟态神經元、量子等技術的發展,AI晶片正不斷突破傳統架構、工藝對性能的束縛,在不同的技術路徑上進行探索創新,呈現出多樣化的發展方向。

(一)AI場景和算法推動AI晶片走向專業化

在AI算法和應用場景的推動下,GPU、FPGA和ASIC正呈現出以滿足專業化需求為特征的發展方向。(1)GPU在處理大量并行計算任務中表現出色,且可通過加速設計更好地發揮AI潛能,但也存在功耗高、成本高等缺點。目前,GPU仍然是AI訓練所需算力的主要硬體選擇。(2)FPGA具有較強的計算能力、較低的試錯成本和足夠的靈活性,但其缺點在于價格較高、程式設計複雜,是以在半定制化AI場景中具備優勢。(3)ASIC具有更高的處理速度和更低的能耗,并且可針對特定AI任務進行優化設計,進而在性能和能耗方面具備更好的綜合素質,這使其在全定制化AI場景中表現優異。

(二)類腦、量子技術推動AI晶片走向多樣化

随着拟态神經元、量子等前沿技術的發展,AI晶片逐漸發展出類腦、量子等多樣化技術路徑的新型晶片,類腦晶片更是開始走向商用化。(1)類腦晶片擁有大規模并行計算、超低功耗和超低延遲等技術潛力,這些優勢使其在未來AI應用場景中扮演重要的角色。未來,類腦晶片的一個重要發展方向就是圍繞AI算法建構更加高效的存算一體計算系統,如開發更加高效的晶片架構、具備更多神經元的晶片等,以不斷疊代更新AI晶片的綜合性能。(2)量子晶片是基于量子力學原理建構的晶片,可推動人類計算能力呈指數級增長,形成“量子優越性”。有專家認為,量子晶片有望徹底解決AI算力瓶頸的問題。未來,随着AI的廣泛應用,整個社會對于AI算力的需求和耗電量将會大幅增加,而量子晶片是解決上述一系列問題的潛在方案。不過,目前量子計算機的發展還面臨着如退相幹等問題,導緻目前量子晶片仍主要存在于實驗室階段,距離商業化較遠。總的來說,類腦晶片和量子晶片作為新型晶片技術,擁有巨大的潛力,将在未來的AI和計算領域發揮重要作用,為我們帶來更高效、更強大的計算能力。

參考文獻:

[1]James A P., Towards strong AI with analogneural chips[C]. International Symposium on Circuits and Systems, 2020.

[2]汪鑫, 人工智能晶片的概念和應用分析[J]. 中國新通信, 2020.

作者簡介

劉紀铖 國務院 發展研究中心國際技術經濟研究所研究二室

研究方向:資訊領域戰略、技術和産業前沿

聯系方式:[email protected]

編輯丨鄭實

技經觀察丨淺析人工智能晶片發展的技術方向

研究所簡介

國際技術經濟研究所(IITE)成立于1985年11月,是隸屬于國務院發展研究中心的非營利性研究機構,主要職能是研究大陸經濟、科技社會發展中的重大政策性、戰略性、前瞻性問題,跟蹤和分析世界科技、經濟發展态勢,為中央和有關部委提供決策咨詢服務。“全球技術地圖”為國際技術經濟研究所官方微信賬号,緻力于向公衆傳遞前沿技術資訊和科技創新洞見。

位址:北京市海澱區小南莊20号樓A座

電話:010-82635522

微信:iite_er

繼續閱讀